摘要
本发明公开了一种强化学习实现RPA流程自动生成的方法,包括如下步骤:步骤1、训练多模态大模型,使多模态大模型具有基于页面截图和任务描述的任务流程分解能力;步骤2、训练过程监督奖励模型,使过程监督奖励模型根据页面截图、任务描述以及上下文,判断下一生成步骤是否正确;步骤3、用过程监督奖励模型对多模态大模型进行强化学习训练,得到任务流程分解模型;步骤4、基于训练后的任务流程分解模型生成详细的RPA步骤,再调取通用大模型API将每一个RPA步骤转化为实际的RPA指令,由RPA指令组成完整的RPA流程。本发明极大地降低模型在流程生成中产生的幻觉,提高了模型分解任务流程的能力,增强了RPA指令选择生成的准确率。
技术关键词
多模态
指令
页面
策略
无监督
对象
算法
数据
索引
轨迹
代表
定义
平台
系统为您推荐了相关专利信息
路径跟踪方法
状态空间方程
多传感器融合
舵轮
控制模块
三维结构
动态建模方法
数据
动态建模系统
多模态
网格剖分方法
节点
计算机程序代码
剖分装置
列表
分布式空间数据库
数据查询处理方法
索引
初始聚类中心
数据库优化技术