基于自然语言的多风格强化学习策略控制方法及系统

AITNT
正文
推荐专利
基于自然语言的多风格强化学习策略控制方法及系统
申请号:CN202411885076
申请日期:2024-12-20
公开号:CN119337965A
公开日期:2025-01-21
类型:发明专利
摘要
本发明提供了一种基于自然语言的多风格强化学习策略控制方法及系统。首先在所需的环境中训练多风格强化学习策略,多风格强化学习策略基于元行为集合,每个元行为与对应的风格参数关联,风格参数代表执行该元行为的倾向性,每个训练时期开始时,随机采样一组风格参数,将风格参数和环境状态拼接后输入智能体,使用强化学习算法训练后得到有多种行为风格的策略;在推理时解析用户的自然语言,结合提示词将用户的自然语言转换为对应元行为的风格参数的数值,将转换得到的数值输入智能体,作为智能体的当前风格参数,即可执行用户指定的行为风格。使用本发明可以实现智能体高度多样化的行为表现,允许用户通过文本或语音调节每种行为风格的程度。
技术关键词
强化学习策略 风格 参数 大语言模型 强化学习算法 指令 控制系统 意图 自然语言转换 数值 样本 场景 代表 模块 概念 格式 文本 语音
系统为您推荐了相关专利信息
1
基于故障保险的助航灯光监控方法及系统
灯光监控 分布式传感器 助航灯光 极值 异常事件
2
一种基于智慧门禁与两票联动的身份认证控制方法及系统
人脸生物特征 智慧门禁 认证控制方法 人脸识别特征 矩阵
3
一种夹杂物数量统计方法以及统计装置
改进型BP神经网络 夹杂物数量 硫化锰 统计方法 球形
4
一种基于知识图谱的高压变压器运维决策方法及系统
运维决策方法 高压变压器 构建知识图谱 大语言模型 节点
5
一种图像识别方法、装置及电子设备
图像识别模型 模态特征 样本 对象 图像识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号