摘要
本发明公开了基于语义的文本内容索引自动标识方法,涉及信息检索技术领域,包括初始化稀疏投影和LSH签名,使用拉格朗日对偶形式和梯度更新进行迭代优化,并对哈希位数进行调整,通过k‑d树得到分片索引,并构建倒排索引,通过Delta编码进行压缩,基于Jaccard相似度构建索引图,通过WebGraph进行压缩,使用CSNMF结合Z‑Laplacian正则化,生成低秩基矩阵和低秩编码矩阵,迭代优化后对压缩倒排索引进行重构,生成重构倒排索引条目。本发明通过多分辨率哈希表初始化、联合特征优化、局部自适应量化以及低秩索引重构,提升索引结构的语义表达能力和压缩效果,提高索引的精度和效率,实现对索引内容的智能标识。
技术关键词
自动标识方法
语义向量
矩阵
生成自然语言
拉格朗日对偶
文本
重构
多分辨率
降维特征
条目
编码
分片
L0范数约束
分区
实体
生成倒排索引
数据
信息检索技术
系统为您推荐了相关专利信息
深度前馈神经网络
非暂态计算机可读存储介质
深度神经网络模型
补偿控制器
数学模型
植被
多尺度分析方法
深度学习模型
协方差矩阵
因子
神经网络方法
电池状态参数
注意力
掩码矩阵
融合特征