摘要
本申请公开了一种流程自动化方法、装置及电子设备。其中,该方法包括:获取用户界面图像;通过视觉识别模型对用户界面图像进行目标检测和文本识别,得到与用户界面图像对应的视觉信息,其中,视觉信息包括用户界面图像中的界面元素信息和文本信息;接收用户请求信息,并通过语义理解模型对用户请求信息和视觉信息进行处理,生成操作指令序列;将操作指令序列转换为操作指令,并依据操作指令自动模拟用户操作行为。本申请解决了由于相关技术中的RPA系统通常基于固定的界面坐标或控件特征,存在界面适应性较差、用户意图理解能力较弱和复杂场景下鲁棒性不足的技术问题。
技术关键词
语义理解模型
自动化方法
视觉
非易失性存储介质
文本识别
图像
元素
序列
界面
光学字符识别
生成可执行
边缘检测算法
存储程序指令
电子设备
自动化装置
计算机程序产品
参数
存储器
系统为您推荐了相关专利信息
印刷生产线
升降组件
上料机器人
抬升机构
视觉传感器
果树剪枝装置
移动单元
机械臂单元
控制单元
视觉
羽毛球
动力学微分方程
捕获图像序列
跟踪方法
模块
采摘机器人
末端执行器组件
臂杆
机械臂组件
茄子
热轧
像素
智能识别系统
AI智能识别
金属冶炼技术