安卓智能体超越行为克隆的策略学习方法和系统

AITNT
正文
推荐专利
安卓智能体超越行为克隆的策略学习方法和系统
申请号:CN202411548421
申请日期:2024-11-01
公开号:CN119443145A
公开日期:2025-02-14
类型:发明专利
摘要
本发明属于人工智能技术领域,涉及一种安卓智能体超越行为克隆的策略学习方法和系统,所述方法包括:1)根据专家演示数据对安卓智能体基座模型进行行为克隆;2)在行为克隆后的安卓智能体基座模型的基础上构造奖励函数,并根据专家演示数据对其进行离线强化学习RWR和AWR训练,以获得最终的安卓智能体。本发明结合行为克隆和离线强化学习的优势设计了一套超越传统行为克隆的策略学习方法,该方法相比于传统行为克隆方法可以学到更优的策略,并且比隐式行为克隆,生成对抗模仿学习等方法更加适用于安卓智能体领域,并且占用资源较少,训练模式简单,相比于离线强化学习方法,该方法不需要训练判别器网络,在奖励稀疏的情况下同样有效。
技术关键词
策略学习方法 安卓智能 基座 离线 强化学习方法 数据 学习设备 克隆方法 参数 大语言模型 人工智能技术 学习系统 处理器 可读存储介质 程序 文本 基础 算法 模块
系统为您推荐了相关专利信息
1
面向工业互联网安全防护的安全大模型构建方法及应用
工业互联网安全 模型构建方法 生成机制 网络安全态势分析 工业自动化系统
2
基于GA-RL的分层多智能体桥隧群维修决策方法及装置
维修决策方法 策略 动作建议 网络健康度 计算机可读取存储介质
3
一种党参蜜片包装系统及其包装方法
党参 输送模块 包装系统 真空模块 切割模块
4
用于对处理工作负载的着色器的动态完整性验证
图形处理器 输入输出虚拟化 存储器 图形处理单元 电路系统
5
多关节可变形的机器人机械臂
机器人机械臂 传动丝杆 调节臂 扇形齿轮 伞齿轮
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号