基于大语言模型的超长文本检索问答方法、装置、设备及介质

AITNT
正文
推荐专利
基于大语言模型的超长文本检索问答方法、装置、设备及介质
申请号:CN202410878463
申请日期:2024-07-02
公开号:CN118820424A
公开日期:2024-10-22
类型:发明专利
摘要
本发明实施例公开了一种基于大语言模型的超长文本检索问答方法、装置、设备及介质,其中,方法包括:对获取的原始超长文本数据进行预处理得到目标数据;采用Embedding编码模型对目标数据进行编码得到编码向量数据,并将编码向量数据存储至向量数据库;将获取的待查询问题输入至大语言模型以输出初始回答数据;采用Embedding编码模型对初始回答数据进行编码得到编码回答向量数据;根据编码回答向量数据对向量数据库中的编码向量数据进行检索得到相似回答向量数据,并将相似回答向量数据输入至大语言模型以生成最终答案结果。本申请实施例提高了超长文本检索问答的准确度。
技术关键词
大语言模型 编码向量 问答方法 样本 词频统计 文本 数据存储 计算机设备 索引算法 答案 处理器 问答装置 可读存储介质 处理单元 存储器 参数
系统为您推荐了相关专利信息
1
克服大语言模型的最大词元限制
节点特征 计算机可读存储器 大语言模型 有向无环图 计算机系统
2
移动通信室内信号监测器的测试方法、系统及存储介质
编码向量 信号监测器 编码特征 分布特征 测试方法
3
基于GC-IMS的检测血清VOCs的胃癌检测方法及系统
胃癌检测方法 有机化合物组合 离子迁移谱图 血清 统计学方法
4
一种交通流量预测方法、装置、电子设备及存储介质
大语言模型 字符 交通流量预测方法 时间段 数据
5
面向智能机器人大面积触觉感知的可拓展单线信号采集系统及方法
传感节点 面向智能机器人 信号采集系统 信号采集方法 单线
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号