大语言模型优化方法和优化装置

正文

推荐专利

大语言模型优化方法和优化装置

申请号：CN202511141940

申请日期：2025-08-15

公开号：CN120633740B

公开日期：2025-12-05

类型：发明专利

摘要

本申请涉及人工智能技术领域，提供了一种大语言模型优化方法和优化装置。该方法通过在预训练大语言模型中输入问题得到候选答案，计算候选答案的第一奖励值、第二奖励值和第三奖励值，其中第一奖励值用于表征候选答案的基础奖励，第二奖励值用于表征候选答案与问题的契合度，第三奖励值用于表征候选答案与用户偏好的对齐程度，然后对第一奖励值、第二奖励值和第三奖励值进行多头融合，得到目标奖励值，最后基于目标奖励值训练预训练大语言模型，得到优化后的大语言模型，实现了以多头分层的方式自适应学习大语言模型不同层次的奖励机制的重要性系数，进而提高了模型训练效率，提升了训练后的模型的生成质量。

技术关键词

大语言模型答案 Softmax函数温度控制策略优化装置基础序列人工智能技术线性输入模块标记指数样本动态数据主题分层机制

系统为您推荐了相关专利信息

一种蛋鸡头部ReID追踪行为识别方法及设备

蛋鸡池化特征识别方法追踪器分类器

基于多梯度兴趣上下文网络的点击率预测方法

点击率预测方法上下文特征广告点击率预测兴趣预测广告点击率

回答问题的方法、装置及电子设备

大语言模型脉冲答案信号构建知识图谱

一种基于大语言模型的智能汽车虚拟仿真测试方法

场景测试方法测试场景大语言模型知识库管理系统仿真软件

一种基于文本重建及词序语义特征的隐写文本检测技术

大语言模型文本检测模型重构特征提取器分类器

大语言模型优化方法和优化装置

站点导航

APP 下载