摘要
本申请提供了一种数据飞轮微调方法和装置,涉及人工智能技术领域。其中,数据飞轮微调方法中包括:基于在线问题和目标模型,获取在线答案和离线答案。其中,在线答案是目标模型在联网检索模式下对在线问题生成的答案,离线答案是目标模型在离线检索模式下对在线问题生成的答案。对在线答案的安全性进行评估,根据评估结果,确定第一在线答案。通过第一在线答案和离线答案构建训练数据集。使用训练数据集对目标模型进行微调。该方法在数据飞轮的数据生产、模型训练、数据筛选与增强和反馈闭环引入安全性评估,引导模型输出的内容满足安全性和可用性。
技术关键词
答案
在线
风险指标值
可用性评估
微调方法
离线
飞轮
数据
云管理平台
扩充模块
计算机程序产品
度量
模式
人工智能技术
微调装置
处理器
指令
系统为您推荐了相关专利信息
钕铁硼薄片
语义特征
在线监测方法
感知特征
协同注意力
学习效果评估
点击流数据
学生
在线
模型训练方法
视频问答方法
多模态注意力
自然语言模型
文本
融合特征