摘要
本发明提供了一种用户查询信息下的智能回复方法、系统、设备及介质,该方法包括以下步骤:对用户提供的文档进行结构化处理,构建包含文档逻辑结构和多模态信息的版面知识块;将版面知识块分解为文本知识块和图片知识块,并对文本知识块和图片知识块生成嵌入向量,存储至向量数据库;结合用户查询信息,对向量数据库进行多模态检索,获得多模态检索结果;基于多模态检索结果,通过大模型输出与用户查询信息对应的回复结果。该方法通过支持跨模态检索、优化图片摘要抽取及利用结构化文档信息,能够全面理解和高效利用文档内容,为用户提供更准确、全面的搜索结果和高质量的问答服务。
技术关键词
智能回复方法
多模态
文本
图片
支持相似性检索
结构化文档信息
元素
摘要
光学字符识别
回复系统
图像
语义
表格
贪心算法
处理器
逻辑
跨模态
输出模块
可读存储介质
指令
系统为您推荐了相关专利信息
风电场电缆
故障分析数据
接头
实时监测方法
生成风电场
视频配音方法
字幕
情绪识别模型
文本生成模型
音频特征参数
敏感数据检测方法
声纹特征
风险
关键词
预训练语言模型