摘要
本发明实施例公开了一种基于大语言模型的超长文本检索问答方法、装置、设备及介质,其中,方法包括:对获取的原始超长文本数据进行预处理得到目标数据;采用Embedding编码模型对目标数据进行编码得到编码向量数据,并将编码向量数据存储至向量数据库;将获取的待查询问题输入至大语言模型以输出初始回答数据;采用Embedding编码模型对初始回答数据进行编码得到编码回答向量数据;根据编码回答向量数据对向量数据库中的编码向量数据进行检索得到相似回答向量数据,并将相似回答向量数据输入至大语言模型以生成最终答案结果。本申请实施例提高了超长文本检索问答的准确度。
技术关键词
大语言模型
编码向量
问答方法
样本
词频统计
文本
数据存储
计算机设备
索引算法
答案
处理器
问答装置
可读存储介质
处理单元
存储器
参数
系统为您推荐了相关专利信息
节点特征
计算机可读存储器
大语言模型
有向无环图
计算机系统
编码向量
信号监测器
编码特征
分布特征
测试方法
胃癌检测方法
有机化合物组合
离子迁移谱图
血清
统计学方法
传感节点
面向智能机器人
信号采集系统
信号采集方法
单线