摘要
本发明涉及调查分析技术领域,具体地说,涉及基于大数据技术的兽医流行病学调查分析系统。其包括数据相似单元、关键程度单元、重要关联单元、分析确定单元,数据相似单元根据动物向量的范数、疾病向量的范数、采集的词语向量的范数计算词语和动物的相似度、词语和疾病的相似度、词频。本发明关键程度单元根据文档的数量和包含词语的文档数计算词语逆文档频率,再利用逆文档频率与词频计算词语在文档中的关键程度值,当关键程度值大于设定的关键程度值时,将词语命名为关键词,通过关键程度可以过滤掉频繁出现的无用词,并避免无用词频繁出现被错误地视为关键信息,突显那些真正重要的信息,提高重要信息的提取效率。
技术关键词
语句
词语
大数据技术
分析系统
关键词
动物
兽医
疾病
频率
模块
字符
变量
渠道
算法
系统为您推荐了相关专利信息
事件知识库
校对方法
文本
非暂态计算机可读存储介质
格式化
故障诊断规则
故障特征
生成对抗网络模型
遥测数据采集模块
时序特征