一种以大语言模型为编码器的文档检索方法和装置

AITNT
正文
推荐专利
一种以大语言模型为编码器的文档检索方法和装置
申请号:CN202510459931
申请日期:2025-04-14
公开号:CN120407782A
公开日期:2025-08-01
类型:发明专利
摘要
本发明实施例涉及一种以大语言模型为编码器的文档检索方法和装置,所述方法包括:选择一款已经完成预训练且能一次性处理K级上下文的大语言模型作为查询、文档、联合编码器;以查询、文档编码器为核心构建相似性评分模型,以联合编码器为核心构建相关性评分模型,并进行模型训练;训练结束后,根据用户输入的查询文本和相似性评分模型对用户指定的文档库进行文档初选,并根据用户输入的查询文本和相关性评分模型对初选文档序列进行文档终选得到终选文档序列向当前用户反馈。本发明可以提升检索准确度。
技术关键词
文档检索方法 编码器 文本 优化器 大语言模型 序列 编码向量 分词 样本 标签 数据 处理单元 语义特征提取 输入端 模式 矩阵 参数 模型训练模块 索引
系统为您推荐了相关专利信息
1
一种阳极炉氧化还原期终点预测方法、系统、设备及介质
终点 多层感知机 阳极 图像增强模块 阶段
2
一种面向语音识别系统的预处理去偏方法
语音识别系统 样本 数据 错误率 文本
3
一种面向神经进化的社区搜索方法
社区搜索方法 节点 邻居 粒子群算法 编码器
4
一种基于大数据的社区公共安全综合风险评估方法
风险评估模型 综合风险评估方法 构建卷积神经网络 多模态 残差模块
5
一种基于语义和结构协同引导的点云配准方法
语义特征 图像分割模型 多模态特征融合 矩阵 图像像素
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号