一种基于自生成与推理评估构建偏好数据的语言模型推理能力优化方法

AITNT
正文
推荐专利
一种基于自生成与推理评估构建偏好数据的语言模型推理能力优化方法
申请号:CN202510983381
申请日期:2025-07-17
公开号:CN120911597A
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种基于自生成与推理评估构建偏好数据的语言模型推理能力优化方法,包括以下步骤:(1)针对给定的输入问题,利用待训练的基础语言模型生成多个不同的候选响应序列;(2)对多个不同的候选响应序列进行质量评估,并提取代表其推理过程特征的信息,构建代表候选响应序列特征的向量;(3)基于质量评估结果和特征向量,为所述输入问题构建一个由优选响应和劣选响应组成的偏好对;(4)利用偏好对对基础语言模型进行训练或优化,以使训练后的模型生成优选响应的概率高于生成劣选响应的概率。本发明无需外部高质量标注数据或大型教师模型,可低成本、高效地提升语言模型在专业领域的性能,尤其推理能力。
技术关键词
能力优化方法 序列特征 动态时间规整算法 自然语言 代表 机器学习算法 语义 基础 答案 数据 系列 低成本 教师 文本 专业 逻辑 策略 关系
系统为您推荐了相关专利信息
1
一种基于区块链与智能合约的审计文件全流程自动化追溯与协作系统及方法
协作系统 数据分析工具 协作平台 技术开发系统 智能合约开发
2
一种基于BI和业务自动化生成报表的方法
RPA机器人 数据管理平台 管理平台模块 生成报表模板 事件驱动架构
3
为在三维场景中发生的事件提供辅助
传感器设备 场景 人工智能系统 语义 数据
4
一种考虑电压幅值、相角的数据-机理驱动线性潮流优化方法
潮流优化方法 电压 线性化潮流 幅值 节点
5
储备资源业务数据分析方法、装置、设备及介质
业务数据分析方法 多业务场景 资源 数据分析程序 业务数据分析装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号