偏好学习方法、模型应用方法、装置、设备和存储介质

AITNT
正文
推荐专利
偏好学习方法、模型应用方法、装置、设备和存储介质
申请号:CN202411820212
申请日期:2024-12-11
公开号:CN119646161A
公开日期:2025-03-18
类型:发明专利
摘要
本公开提供了一种偏好学习方法,可以应用于人工智能技术领域。该偏好学习方法包括:从大模型预训练的文本文档中,确定与预设标准相匹配的样本问题,其中,预设标准中包括正向标准和反向标准,样本问题用于表征用户与大模型交互时所产生的问题;将多个样本问题输入大模型中,以根据大模型输出的与每个样本问题对应的答案,生成多个问答对;利用多个评估模型,基于正向标准分别对每个问答对中的答案进行评估,得到与每个问答对对应的评估标签;利用基于评估标签生成的偏好数据,对大模型进行训练,得到与正向标准对齐的目标模型。本公开还提供了一种模型应用方法、偏好学习装置、设备、存储介质和程序产品。
技术关键词
答案 模型预训练 样本 标签 学习方法 学习装置 多模型 模型训练模块 人工智能技术 计算机程序产品 处理器 数据 指令 可读存储介质 电子设备 存储器 关系
系统为您推荐了相关专利信息
1
基于轮廓增强和协同训练的半监督SAR目标识别方法及系统
识别方法 标签训练集 半监督学习 轮廓提取 感兴趣
2
一种人工智能图像生成方法、装置
人工智能图像 注意力 文本 样本 融合图像特征
3
寄生参数提取神经网络分布式训练方法及装置
寄生参数提取 分布式训练方法 训练样本数据 模型更新 互连线
4
一种三维目标的重建和单体化方法与系统
单体化方法 孪生神经网络 标签 掩膜 视频
5
一种地表水径流量估算方法与系统
径流 地表水 短波红外波段 反射率差异 历史数据查询
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号