基于语义的文本内容索引自动标识方法

AITNT
正文
推荐专利
基于语义的文本内容索引自动标识方法
申请号:CN202510872529
申请日期:2025-06-26
公开号:CN120705247A
公开日期:2025-09-26
类型:发明专利
摘要
本发明公开了基于语义的文本内容索引自动标识方法,涉及信息检索技术领域,包括初始化稀疏投影和LSH签名,使用拉格朗日对偶形式和梯度更新进行迭代优化,并对哈希位数进行调整,通过k‑d树得到分片索引,并构建倒排索引,通过Delta编码进行压缩,基于Jaccard相似度构建索引图,通过WebGraph进行压缩,使用CSNMF结合Z‑Laplacian正则化,生成低秩基矩阵和低秩编码矩阵,迭代优化后对压缩倒排索引进行重构,生成重构倒排索引条目。本发明通过多分辨率哈希表初始化、联合特征优化、局部自适应量化以及低秩索引重构,提升索引结构的语义表达能力和压缩效果,提高索引的精度和效率,实现对索引内容的智能标识。
技术关键词
自动标识方法 语义向量 矩阵 生成自然语言 拉格朗日对偶 文本 重构 多分辨率 降维特征 条目 编码 分片 L0范数约束 分区 实体 生成倒排索引 数据 信息检索技术
系统为您推荐了相关专利信息
1
三维点云数据的去噪优化方法、装置、设备、介质和产品
三维点云数据 降噪模型 彩色图像 矩阵 拉普拉斯
2
一种基于深度学习的最优算力控制方法
深度前馈神经网络 非暂态计算机可读存储介质 深度神经网络模型 补偿控制器 数学模型
3
一种信号发生模块的控制方法及装置
植被 多尺度分析方法 深度学习模型 协方差矩阵 因子
4
结合专家评估规则和大语言模型的提示词优化方法
模糊聚类分析 关键词 键值 编码向量 标签
5
一种分离时变与时不变因果特征的图神经网络方法
神经网络方法 电池状态参数 注意力 掩码矩阵 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号