面向文本检索的自适应长度嵌入方法及系统

AITNT
正文
推荐专利
面向文本检索的自适应长度嵌入方法及系统
申请号:CN202510825470
申请日期:2025-06-19
公开号:CN120723889A
公开日期:2025-09-30
类型:发明专利
摘要
本发明提供了一种面向文本检索的自适应长度嵌入方法及系统,包括:使用训练好的嵌入模型将原始文档编码成高维嵌入向量,得到原始文档嵌入矩阵X∈Rn×d;将所述嵌入向量通过转换矩阵拟合模块进行学习变换矩阵,得到转换后嵌入向量;将所述转换后嵌入向量输入至混合编码模块进行混合编码,把每个文档的转换后嵌入向量分为定长稠密部分和变长稀疏部分,并根据文档的语义复杂度动态调整稀疏部分的长度,之后结合稠密和稀疏部分进行相似度计算,从而实现自适应的文本检索。本发明不仅显著提升了系统的资源利用效率,还保证了检索的准确性和鲁棒性。特别适合于大规模检索系统以及对存储和计算资源要求严格的应用环境。
技术关键词
嵌入方法 编码模块 协方差矩阵 复杂度 语义 线性 检索系统 特征值 成分分析 样本 动态 文本 鲁棒性 定义 索引 数据 元素
系统为您推荐了相关专利信息
1
一种基于大模型的话务批量打标签方法、装置及可读存储介质
打标签方法 语义向量 批量 语句 分析模块
2
基于表征偏移约束的大模型持续学习方法、装置和设备
持续学习方法 分类器 阶段 数据 自然语言
3
基于人工智能的计算机数据智能分析系统
计算机数据智能 标签 分析系统 子模块 频率
4
文本标注方法、装置、设备及存储介质
文本标注方法 文本处理模型 神经网络模型训练 聚类 可读存储介质
5
一种目标转换语言确定方法、装置、设备及存储介质
排版信息 游戏场景 语义 字符识别 格式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号