交互方法、装置、智能体、电子设备及存储介质

正文

推荐专利

申请号：CN202510330732

申请日期：2025-03-19

公开号：CN120196721A

公开日期：2025-06-24

类型：发明专利

摘要

本公开提供了一种交互方法、装置、智能体、电子设备及存储介质，涉及人工智能技术领域，尤其涉及大模型、强化学习等技术领域。具体实现方案为：响应于接收目标问题文本，基于目标问题文本，生成提示指令；以及将提示指令输入目标大语言模型，得到符合目标任务规范的目标答案文本；其中，用于训练目标大语言模型的方法包括：响应于针对目标任务的模型训练请求，确定与目标任务关联的至少一个行业奖励模型；利用通用奖励模型和至少一个行业奖励模型分别处理答案文本，得到通用推理奖励和至少一个行业推理奖励；基于通用推理奖励和至少一个行业推理奖励，得到复合奖励；以及利用复合奖励对大语言模型进行强化学习训练，得到目标大语言模型。

技术关键词

大语言模型文本答案样本交互方法指令输入模块电子设备数值人工智能技术格式关键词计算机程序产品交互装置符号处理器通信输出模块

系统为您推荐了相关专利信息

一种智能异响感知电力故障诊断问答系统及其方法

电力故障诊断问答系统答案记忆体文本

标签信息的确定方法、装置、存储介质、电子设备和程序产品

字符序列数据标签条件随机场模型

一种基于生成对抗网络的重力坝智能设计方法

生成对抗网络智能设计方法拓扑优化方法分区设计约束条件

一种预估程序执行时间的校正方法

程序执行时间时钟校正方法聚类周期

一种最优消纳的光伏电站优化设计方法及装置

光伏电站优化设计方法负荷曲线皮尔逊相关系数

交互方法、装置、智能体、电子设备及存储介质

站点导航

APP 下载