摘要
本申请涉及一种问答数据生成方法、装置及存储介质,所述方法包括:获取文档图像,以及问答对生成提示;根据所述文档图像以及所述问答对生成提示,生成多个初步问答对;对多个所述初步问答对进行质量筛选,得到多个筛选问答对;对多个所述筛选问答对进行一致性校验,得到多个目标问答对。通过文档图像以及问答对生成提示,生成多个初步问答对,并对多个初步问答对进行质量筛选以及一致性校验,得到多个目标问答对,如此可以保证问答对的正确性,且不需要人工干预,可以针对复杂格式和多种类型的文档图像提出合适的问题。
技术关键词
文档图像内容
大语言模型
问答数据生成方法
多模态
答案
数据生成装置
校验模块
语义
格式
处理器
程序
系统为您推荐了相关专利信息
文档特征
图像类别标签
医学
文本
数据库构建方法
分类方法
科技
生物识别
物联网数据分析
区块链数据结构
产品智能推荐方法
问答知识库
文本
关键词
生成产品
车牌字符识别方法
深度神经网络模型
多模态信息
图像视觉特征
注意力