摘要
本发明属于数据集构建技术领域,尤其涉及一种用于大模型文档问答的指令微调数据集构建方法,包括:对获取的非结构化知识文档数据集进行预处理;采用视觉大语言模型对文档中的非结构化信息进行识别,生成文本性描述;结合文本描述和对应的文本问题内容,采用文本推理模型增强答案生成;再通过过滤策略提取优质数据及其推理过程;将推理过程与正确答案拼接作为答案部分,最终构建原始文档问答视觉推理数据集。采用本发明的方法不仅提升了问答数据集的丰富性和多样性,还使其能够更好地适应包含复杂视觉信息的文档问答场景,为文档视觉问答任务提供了更高质量的数据支持。
技术关键词
数据集构建方法
视觉推理
答案
大语言模型
文本区域检测
指令
问答场景
图表
策略
格式
图像
表格
金融
风格
蒸馏
报告
科技
系统为您推荐了相关专利信息
自然资源
交互操作方法
监测系统
自然语言
实体关系抽取
受限玻尔兹曼机
大语言模型
前庭功能测试
周期调节方法
训练场景