摘要
本申请公开了行业大模型的内容安全能力构建方法、装置、设备及介质,涉及人工智能技术领域,包括:基于预设数据拉取频率拉取行业大模型的生产环境中的用户交互数据;调用预设超大规模模型对待判别提问数据进行风险判别,以根据判别结果确定是否存在被误判的目标提问数据;若存在,则对目标提问数据的数据标签进行修正,并基于修正后数据和预设超大规模模型扩充原始数据集,以便利用扩充后数据集对安全模型进行迭代训练,并将预设超大规模模型的知识迁移至安全模型中;基于用户反馈数据以及预设超大规模模型构建偏好对数据集,并对行业大模型进行价值对齐训练,以控制行业大模型的生成内容满足预设价值观念。
技术关键词
超大规模
知识蒸馏技术
强化学习算法
数据标签
置信度阈值
风险
矩阵
模型训练模块
数据存储
评分机制
扩充模块
人工智能技术
判别模块
平滑度
可读存储介质
频率
系统为您推荐了相关专利信息
边界控制方法
模型预测控制算法
交通系统
强化学习算法
动态
无人机
栅格地图
强化学习算法
路径规划算法
障碍物
控温方法
分布式传感器网络
优化控制策略
门窗
长短期记忆网络
强化学习算法
节点
测试用例生成装置
生成方法
电子设备
AI服务器
智能运维系统
故障风险评估
深度强化学习算法
网络效能