摘要
本发明提供基于权重分配和实体标注的数据发现方法、系统、设备及介质,属于数据搜索处理技术领域,对数据进行预处理操作;根据数据的实际特征,采用机器学习算法动态调整各数据项的权重;配置自适应权重分配模型,并采用多层实体标注方式对数据中的实际特征进行标注;构建倒排索引检索模型,根据自适应权重分配模型,提取每个数据项提取特征,分配相应的权重,并进行评分计算,根据得分,进行排序,反馈给用户;通过收集并分析用户搜索数据,动态调整自适应权重分配、搜索与排序算法及索引性能优化策略,并迭代执行评估与优化,结合用户反馈机制形成闭环。本发明能够准确反映不同特征对搜索结果的重要性。能够更好地满足用户多样化的搜索需求。
技术关键词
数据发现方法
皮尔逊相关系数
实体
机器学习算法
数据项
关系分类器
层级
排序算法
索引
构建数据图谱
交叉验证方法
动态
BERT模型
发现系统
闭环
特征值
处理器
系统为您推荐了相关专利信息
信息检索匹配方法
科研
计算机可存储介质
文本
信息数据处理终端
数据安全拷贝方法
硬件隔离技术
身份认证系统
动态隔离模块
预警系统