摘要
本发明提供数字化档案检索中的实例库优化方法、系统及存储介质,通过将结构化数据与非结构化数据的转换结果用于检索偏移概率预测,实现将高校数字化档案的检索优化从检索环节前推到非结构化数据转换环节,能够较早地发现检索的数据源问题,对非结构化数据的转换结果进行优化,减少非结构化数据在结构化处理过程中丢失数据背景和隐含关系的可能性,将数据外部结构特征与内部语义特征深度融合,以便形成可供检索的结构化数据,以动态调整档案检索规划,为档案检索提供丰富的语义信息、价值信息以及档案数据之间的关联关系。
技术关键词
离散特征
数据
语义向量
融合特征
实体
注意力机制
编码器
Sigmoid函数
神经网络模型
模块
分词
构建算法
动态
序列
语义特征
可读存储介质
索引
关系