摘要
本发明属于工业领域,具体涉及一种基于设备运维文档的大语言模型多模态检索增强问答方法。步骤1:将设备运维的PDF文档转化为markdown格式文档;步骤2:基于步骤1的markdown格式文档进行多模态图像字幕的生成;步骤3:基于步骤2生成的多模态图像字幕先进行知识解析,再进行向量化编码与相似性检索;步骤4:利用步骤2生成的多模态图像字幕,并通过步骤3的向量化编码与相似性检索以辅助基于大语言模型的文本问答生成,实现基于设备运维文档的大语言模型多模态检索增强问答。针对设备运维文档这一专业性强的文档,用以解决多种模态的信息解析与理解问题。
技术关键词
大语言模型
多模态
字幕
问答方法
运维
图像
文本
格式
信息编码
可读存储介质
图片
表格
模块
问答系统
处理器
编码向量
计算机设备
索引
存储器
系统为您推荐了相关专利信息
视频标注方法
音频特征提取
融合特征
特征提取网络
视觉特征
多智能体系统
安全性检测方法
多模态特征
文本
图像
电网设备运行状态
故障监测系统
故障诊断模块
加权主成分分析
图像采集模块