一种基于自生成与推理评估构建偏好数据的语言模型推理能力优化方法

正文

推荐专利

申请号：CN202510983381

申请日期：2025-07-17

公开号：CN120911597A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种基于自生成与推理评估构建偏好数据的语言模型推理能力优化方法，包括以下步骤：(1)针对给定的输入问题，利用待训练的基础语言模型生成多个不同的候选响应序列；(2)对多个不同的候选响应序列进行质量评估，并提取代表其推理过程特征的信息，构建代表候选响应序列特征的向量；(3)基于质量评估结果和特征向量，为所述输入问题构建一个由优选响应和劣选响应组成的偏好对；(4)利用偏好对对基础语言模型进行训练或优化，以使训练后的模型生成优选响应的概率高于生成劣选响应的概率。本发明无需外部高质量标注数据或大型教师模型，可低成本、高效地提升语言模型在专业领域的性能，尤其推理能力。

技术关键词

能力优化方法序列特征动态时间规整算法自然语言代表机器学习算法语义基础答案数据系列低成本教师文本专业逻辑策略关系

系统为您推荐了相关专利信息

一种基于区块链与智能合约的审计文件全流程自动化追溯与协作系统及方法

协作系统数据分析工具协作平台技术开发系统智能合约开发

一种基于BI和业务自动化生成报表的方法

RPA机器人数据管理平台管理平台模块生成报表模板事件驱动架构

为在三维场景中发生的事件提供辅助

传感器设备场景人工智能系统语义数据

一种考虑电压幅值、相角的数据-机理驱动线性潮流优化方法

潮流优化方法电压线性化潮流幅值节点

储备资源业务数据分析方法、装置、设备及介质

业务数据分析方法多业务场景资源数据分析程序业务数据分析装置

一种基于自生成与推理评估构建偏好数据的语言模型推理能力优化方法

站点导航

APP 下载