摘要
本发明提供一种基于大数据的会议信息处理方法及系统,获取待处理会议文档及所属的会议文档语料库;计算词项的位置与区域加权词频;基于文档主题类簇的划分结果,计算所述词项在所属类簇内的类内逆文档频率;基于所述位置与区域加权词频与所述类内逆文档频率的乘积得到所述词项的初始权重;筛选出权重大于第一预设阈值的核心词项;构建所述核心词项的加权共现网络图;将各核心词项的初始权重作为在所述加权共现网络图中的初始权重,通过预设的图排序迭代算法,根据图中节点的连接关系和边的权重,迭代更新各核心词项节点的权重,当各节点的权重收敛或达到预设迭代次数时,将得到的权重作为所述核心词项的权重。
技术关键词
文档语料库
会议信息处理方法
核心
节点
算术平均值
迭代算法
层次聚类算法
滑动窗口
主题
频率
大数据
摘要
信息处理系统
语句
模块
关系
阻尼
序列
系统为您推荐了相关专利信息
协同优化方法
变量
强化学习模型
文化遗产保护
混沌粒子群优化算法
光伏变流器
分布式光伏集群
发电控制方法
有功功率
发电控制装置
路径规划方法
蚁群算法
节点
自定义参数
陆空两栖无人机
低压故障
低压计量装置
网络拓扑关系
配电系统
分支线开关