一种基于关键词的文件信息识别方法及系统

AITNT
正文
推荐专利
一种基于关键词的文件信息识别方法及系统
申请号:CN202510737549
申请日期:2025-06-04
公开号:CN120256628A
公开日期:2025-07-04
类型:发明专利
摘要
本发明提供一种基于关键词的文件信息识别方法及系统,获取现有文件,基于现有文件建立文件数据库,根据获取的预设行业术语数据对文件数据库内现有文件进行聚类,获取关键词第一聚类结果,基于BM25模型获取现有文件与查询关键词的相关性评分,基于相关性评分对关键词第一聚类结果进行优化聚类,获取关键词第二聚类结果,根据关键词第二聚类结果结合电磁场模拟方式构建关键词语义关联磁场,获取用户历史查询数据,并基于用户历史查询数据建立个性化动态权重,根据个性化动态权重与关键词语义关联磁场获取关键词第三聚类结果,基于关键词第三聚类结果为用户在文件数据库中识别匹配对应现有文件,通过该方法可提升用户查询匹配文档文件的精确度。
技术关键词
行业术语 信息识别方法 查询关键词 饱和度参数 语义 动态 兴趣 信息识别系统 指标 数据 生成关键词 初始聚类中心 核心 索引 查询意图 模块
系统为您推荐了相关专利信息
1
一种资源受限设备的皮带落煤检测方法
资源受限设备 事件相机 皮带 高斯混合模型 图像
2
基于行为分析的虚拟角色交互内容生成方法及系统
语义向量 VR交互 交互内容生成方法 可视化界面 偏好特征
3
一种基于几何感知的特征匹配方法
特征匹配方法 关键点 传递器 节点特征 多层感知器
4
可控文本生成方法、装置及设备
预测类别 大语言模型 文本生成方法 关键词 语义
5
基于多模态数据的影视资源推荐方法、装置、设备及存储介质
资源推荐模型 影视资源推荐方法 跨模态 数据 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号