一种基于用户操作视频的RPA指令生成方法

AITNT
正文
推荐专利
一种基于用户操作视频的RPA指令生成方法
申请号:CN202510171987
申请日期:2025-02-17
公开号:CN119629406A
公开日期:2025-03-14
类型:发明专利
摘要
本发明公开了一种基于用户操作视频的RPA指令生成方法,包括如下步骤:步骤1、基于目标检测算法识别用户操作视频中网页内的界面元素,并获取界面元素变化的时间戳;步骤2、基于视频理解模型对用户操作录制视频进行分析,获取单帧图像和文本特征,将时间戳注入单帧图像中形成视觉特征,再将视觉特征和文本特征融合得到多模态特征;步骤3、对多模态特征进行解码,获得界面元素与用户操作行为的映射关系,然后将映射关系封装成RPA指令。本发明实现对用户操作行为的深度理解和RPA指令的自动化生成,从而提高自动化流程的准确性和完整性。
技术关键词
指令生成方法 视觉特征 视频 多模态特征 跨模态 元素 时间定位 文本 操作界面 注意力机制 损失函数优化 解码器 图像 数据 算法
系统为您推荐了相关专利信息
1
一种基于大模型的剧本智能生成方法、系统及设备
智能生成方法 生成规则 智能生成系统 人物特征 画像
2
一种继电保护专家指导动作捕捉系统
运动轨迹数据 动作捕捉模块 动作捕捉系统 作业现场 高清摄像头
3
一种多模态遥感影像渐进式配准方法和系统
配准方法 深度特征提取网络 训练深度学习模型 灾害遥感 多尺度特征金字塔
4
基于去噪扩散模型的实车动力电池容量衰减轨迹预测方法
充放电数据 电池单体 轨迹预测模型 电池健康状态 轨迹预测方法
5
一种多模态图像融合与识别方法
识别方法 模态特征 多头注意力机制 可见光图像 多模态图像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号