一种训练数据生成方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
一种训练数据生成方法、装置、计算机设备及存储介质
申请号:CN202511052054
申请日期:2025-07-29
公开号:CN120929834A
公开日期:2025-11-11
类型:发明专利
摘要
本发明涉及人工智能技术领域,公开了一种训练数据生成方法、装置、计算机设备及存储介质,方法包括:获取问答对话的上下文信息以及原始回复数据;以所述问答对话的上下文信息作为输入,以所述原始回复数据作为提示词,基于预先构建的第一开源模型,生成思考过程数据;基于预先构建的第二开源模型,对所述思考过程数据进行质量评估,得到评估结果;当所述评估结果通过时,将所述思考过程数据加入训练数据集中,当所述评估结果未通过时,丢弃所述思考过程数据。本发明可应用于金融科技、医疗健康等业务平台中,解决了现有技术中蒸馏技术蒸馏出来的问答模型风格失真及思考过程质量评估体系缺失的技术问题。
技术关键词
训练数据生成方法 一致性检测 计算机可读指令 计算机设备 冗余 数据生成装置 逻辑 可读存储介质 问答模型 人工智能技术 医疗健康 数据获取模块 处理器 蒸馏 格式 存储器 金融
系统为您推荐了相关专利信息
1
一种基于扩散模型的发型替换视频生成方法及装置
视频生成方法 关键帧 视频生成装置 运动向量 像素点
2
基于Segment Anything与开集分类的轨道异物智能识别方法
智能识别方法 轨道 图像分割 图像编码器 背景图
3
一种云服务组合优选方法、装置、设备、介质及产品
云服务组合 阶段 位置更新 因子 处理器
4
一种基于副语言声学特征的会议摘要生成方法
会议摘要生成方法 语音特征 文本 声学特征 深度学习模型
5
一种基于弱标签数据的图像兴趣区域提取方法及系统
旋转矩形框 图像兴趣区域 图像分割模型 样本 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号