摘要
本发明提供的数据生成方法、装置、电子设备及存储介质,方法包括:获取与目标内容相关的原始多模态数据,并将原始多模态数据转换为纯文本数据;根据纯文本数据和提示信息生成第一阶段问答对;用第一阶段问答对中的第一答复文本和新提示信息生成多个第二阶段问答对;其中,第二阶段问答对中的问题文本是通过拆解第一答复文本生成的;把各第二阶段问答对中第二答复文本的组合结果和第一阶段问答对的问题文本,作为目标内容的库内数据。本发明能够有效缓解了数据库中垂直领域文本数据稀缺的问题,提升数据库中垂直领域的数据质量。
技术关键词
数据生成方法
文本
多模态
关键帧
语义
数据生成装置
电子设备
音频
视觉
字符识别
处理器
存储器
视频
图像
指令
语音
模块