基于自然语言的多风格强化学习策略控制方法及系统

正文

推荐专利

申请号：CN202411885076

申请日期：2024-12-20

公开号：CN119337965A

公开日期：2025-01-21

类型：发明专利

摘要

本发明提供了一种基于自然语言的多风格强化学习策略控制方法及系统。首先在所需的环境中训练多风格强化学习策略，多风格强化学习策略基于元行为集合，每个元行为与对应的风格参数关联，风格参数代表执行该元行为的倾向性，每个训练时期开始时，随机采样一组风格参数，将风格参数和环境状态拼接后输入智能体，使用强化学习算法训练后得到有多种行为风格的策略；在推理时解析用户的自然语言，结合提示词将用户的自然语言转换为对应元行为的风格参数的数值，将转换得到的数值输入智能体，作为智能体的当前风格参数，即可执行用户指定的行为风格。使用本发明可以实现智能体高度多样化的行为表现，允许用户通过文本或语音调节每种行为风格的程度。

技术关键词

强化学习策略风格参数大语言模型强化学习算法指令控制系统意图自然语言转换数值样本场景代表模块概念格式文本语音

系统为您推荐了相关专利信息

基于故障保险的助航灯光监控方法及系统

灯光监控分布式传感器助航灯光极值异常事件

一种基于智慧门禁与两票联动的身份认证控制方法及系统

人脸生物特征智慧门禁认证控制方法人脸识别特征矩阵

一种夹杂物数量统计方法以及统计装置

改进型BP神经网络夹杂物数量硫化锰统计方法球形

一种基于知识图谱的高压变压器运维决策方法及系统

运维决策方法高压变压器构建知识图谱大语言模型节点

一种图像识别方法、装置及电子设备

图像识别模型模态特征样本对象图像识别方法

基于自然语言的多风格强化学习策略控制方法及系统

站点导航

APP 下载