摘要
本发明涉及人工智能技术领域,公开了一种训练数据生成方法、装置、计算机设备及存储介质,方法包括:获取问答对话的上下文信息以及原始回复数据;以所述问答对话的上下文信息作为输入,以所述原始回复数据作为提示词,基于预先构建的第一开源模型,生成思考过程数据;基于预先构建的第二开源模型,对所述思考过程数据进行质量评估,得到评估结果;当所述评估结果通过时,将所述思考过程数据加入训练数据集中,当所述评估结果未通过时,丢弃所述思考过程数据。本发明可应用于金融科技、医疗健康等业务平台中,解决了现有技术中蒸馏技术蒸馏出来的问答模型风格失真及思考过程质量评估体系缺失的技术问题。
技术关键词
训练数据生成方法
一致性检测
计算机可读指令
计算机设备
冗余
数据生成装置
逻辑
可读存储介质
问答模型
人工智能技术
医疗健康
数据获取模块
处理器
蒸馏
格式
存储器
金融
系统为您推荐了相关专利信息
视频生成方法
关键帧
视频生成装置
运动向量
像素点
会议摘要生成方法
语音特征
文本
声学特征
深度学习模型
旋转矩形框
图像兴趣区域
图像分割模型
样本
标签