面向文本检索的自适应长度嵌入方法及系统

正文

推荐专利

面向文本检索的自适应长度嵌入方法及系统

申请号：CN202510825470

申请日期：2025-06-19

公开号：CN120723889A

公开日期：2025-09-30

类型：发明专利

摘要

本发明提供了一种面向文本检索的自适应长度嵌入方法及系统，包括：使用训练好的嵌入模型将原始文档编码成高维嵌入向量，得到原始文档嵌入矩阵X∈Rn×d；将所述嵌入向量通过转换矩阵拟合模块进行学习变换矩阵，得到转换后嵌入向量；将所述转换后嵌入向量输入至混合编码模块进行混合编码，把每个文档的转换后嵌入向量分为定长稠密部分和变长稀疏部分，并根据文档的语义复杂度动态调整稀疏部分的长度，之后结合稠密和稀疏部分进行相似度计算，从而实现自适应的文本检索。本发明不仅显著提升了系统的资源利用效率，还保证了检索的准确性和鲁棒性。特别适合于大规模检索系统以及对存储和计算资源要求严格的应用环境。

技术关键词

嵌入方法编码模块协方差矩阵复杂度语义线性检索系统特征值成分分析样本动态文本鲁棒性定义索引数据元素

系统为您推荐了相关专利信息

一种基于大模型的话务批量打标签方法、装置及可读存储介质

打标签方法语义向量批量语句分析模块

基于表征偏移约束的大模型持续学习方法、装置和设备

持续学习方法分类器阶段数据自然语言

基于人工智能的计算机数据智能分析系统

计算机数据智能标签分析系统子模块频率

文本标注方法、装置、设备及存储介质

文本标注方法文本处理模型神经网络模型训练聚类可读存储介质

一种目标转换语言确定方法、装置、设备及存储介质

排版信息游戏场景语义字符识别格式

面向文本检索的自适应长度嵌入方法及系统

站点导航

APP 下载