基于大语言模型的超长文本检索问答方法、装置、设备及介质

正文

推荐专利

申请号：CN202410878463

申请日期：2024-07-02

公开号：CN118820424A

公开日期：2024-10-22

类型：发明专利

摘要

本发明实施例公开了一种基于大语言模型的超长文本检索问答方法、装置、设备及介质，其中，方法包括：对获取的原始超长文本数据进行预处理得到目标数据；采用Embedding编码模型对目标数据进行编码得到编码向量数据，并将编码向量数据存储至向量数据库；将获取的待查询问题输入至大语言模型以输出初始回答数据；采用Embedding编码模型对初始回答数据进行编码得到编码回答向量数据；根据编码回答向量数据对向量数据库中的编码向量数据进行检索得到相似回答向量数据，并将相似回答向量数据输入至大语言模型以生成最终答案结果。本申请实施例提高了超长文本检索问答的准确度。

技术关键词

大语言模型编码向量问答方法样本词频统计文本数据存储计算机设备索引算法答案处理器问答装置可读存储介质处理单元存储器参数

系统为您推荐了相关专利信息

克服大语言模型的最大词元限制

节点特征计算机可读存储器大语言模型有向无环图计算机系统

移动通信室内信号监测器的测试方法、系统及存储介质

编码向量信号监测器编码特征分布特征测试方法

基于GC-IMS的检测血清VOCs的胃癌检测方法及系统

胃癌检测方法有机化合物组合离子迁移谱图血清统计学方法

一种交通流量预测方法、装置、电子设备及存储介质

大语言模型字符交通流量预测方法时间段数据

面向智能机器人大面积触觉感知的可拓展单线信号采集系统及方法

传感节点面向智能机器人信号采集系统信号采集方法单线

基于大语言模型的超长文本检索问答方法、装置、设备及介质

站点导航

APP 下载