一种基于大模型的多模态文档检索增强生成方法

AITNT
正文
推荐专利
一种基于大模型的多模态文档检索增强生成方法
申请号:CN202510155596
申请日期:2025-02-12
公开号:CN119988588A
公开日期:2025-05-13
类型:发明专利
摘要
本发明属于多模态数据处理技术领域,具体涉及一种基于大模型的多模态文档检索增强生成方法,包括:接收用户针对多模态文档输入的查询内容;采用嵌入式模型对查询内容进行处理,生成表征用户查询语义信息的查询向量,并存储在向量数据库中;对多模态文档进行解析,得到长文本信息,采用递归分块策略将长文本信息切分为数据块,对数据块进行编号标记;采用嵌入式模型对数据块进行向量化处理,以生成文档向量并存储至向量数据库中,构建分层索引结构;基于查询向量在向量数据库中进行检索,返回检索结果;利用大语言模型对检索结果进行处理,生成符合用户查询意图的响应内容。本发明能够有效解析和处理多模态文档,提高解析的准确性和全面性。
技术关键词
生成方法 语音输入方式 度计算方法 分块策略 大语言模型 多模态 语义 数据 索引 查询意图 生成文档 自然语言技术 自然语言文本 答案 查询关键词 语音识别技术 随机梯度下降 图像识别技术
系统为您推荐了相关专利信息
1
一种基于Lora微调提升大语言模型中医知识回答能力方法
文本 微调技术 大语言模型 参数 矩阵
2
一种通用对抗样本生成方法、装置、设备、介质及产品
样本生成方法 数据 网络入侵检测模型 计算机程序产品 可读存储介质
3
视频生成方法、装置、电子设备和存储介质
语音特征 视频生成方法 对象 文本 视频生成装置
4
语义地图的生成方法、清洁控制方法、清洁机器人、介质及产品
语义地图 清洁控制方法 生成方法 图像采集装置 对象
5
基于大语言模型微调技术的机器生成文本检测方法与系统
文本检测方法 微调技术 大语言模型 分类特征 焦点损失函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号