生成任务执行结果的方法、装置、设备及介质

正文

推荐专利

申请号：CN202510787865

申请日期：2025-06-13

公开号：CN120407123B

公开日期：2025-09-30

类型：发明专利

摘要

本申请涉及人工智能技术领域，提供了一种生成任务执行结果的方法、装置、设备及介质。该方法通过基于任务描述确定奖励评价智能体集合，为集合中每个奖励评价智能体确定权重；使用预训练策略模型基于任务描述得到至少一个采样结果，利用各奖励评价智能体分别对每一个采样结果进行评价，并基于各奖励评价智能体的权重及评价结果确定策略模型奖励值，基于该奖励值训练策略模型，最后使用训练好的策略模型确定任务执行结果，实现了为非确定性任务自动、准确匹配多个合适的奖励评价智能体，并使用该多个奖励评价智能体联合训练策略模型以提高策略模型的评价准确度，进而得到更符合任务描述的任务执行结果，提升了用户体验。

技术关键词

策略场景可读存储介质人工智能技术处理器算法采样模块存储器计算机对象电子设备

系统为您推荐了相关专利信息

一种基于大语言模型的科学文献实验数据提取方法及装置

数据提取方法大语言模型关键词脚本格式

一种用户服务的智能回复方法、介质及电子设备

深度学习模型智能回复方法意图识别识别用户意图意图类别

一种基于气象要素协同的自适应水力平衡调节方法及装置

水力平衡调节方法区域供热系统模糊控制规则拉格朗日插值法水力平衡调节装置

一种基于大语言模型的语句级别代码摘要生成以及自动化评估方法和系统

自动化评估方法大语言模型摘要自动化评估系统生成代码

一种基板表面异物检测方法、智能清扫系统及输送设备

智能清扫系统异物检测方法实时图像清扫机构图像采集单元

生成任务执行结果的方法、装置、设备及介质

站点导航

APP 下载