摘要
本发明提供一种基于关键词的文件信息识别方法及系统,获取现有文件,基于现有文件建立文件数据库,根据获取的预设行业术语数据对文件数据库内现有文件进行聚类,获取关键词第一聚类结果,基于BM25模型获取现有文件与查询关键词的相关性评分,基于相关性评分对关键词第一聚类结果进行优化聚类,获取关键词第二聚类结果,根据关键词第二聚类结果结合电磁场模拟方式构建关键词语义关联磁场,获取用户历史查询数据,并基于用户历史查询数据建立个性化动态权重,根据个性化动态权重与关键词语义关联磁场获取关键词第三聚类结果,基于关键词第三聚类结果为用户在文件数据库中识别匹配对应现有文件,通过该方法可提升用户查询匹配文档文件的精确度。
技术关键词
行业术语
信息识别方法
查询关键词
饱和度参数
语义
动态
兴趣
信息识别系统
指标
数据
生成关键词
初始聚类中心
核心
索引
查询意图
模块
系统为您推荐了相关专利信息
语义向量
VR交互
交互内容生成方法
可视化界面
偏好特征
特征匹配方法
关键点
传递器
节点特征
多层感知器
资源推荐模型
影视资源推荐方法
跨模态
数据
多模态