一种基于多模态模型的RPA元素锚点自动寻找方法

AITNT
正文
推荐专利
一种基于多模态模型的RPA元素锚点自动寻找方法
申请号:CN202510185798
申请日期:2025-02-20
公开号:CN119669600B
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种基于多模态模型的RPA元素锚点自动寻找方法,按下述步骤进行:步骤S1:获取网页中目标元素以及候选锚点元素的坐标、文本信息和区域截图;步骤S2:根据区域截图,通过目标检测模型获取目标元素以及候选锚点元素的元素类别;步骤S3:将目标元素和候选锚点元素的坐标、文本信息、区域截图以及元素类别输入多模态模型内,利用多模态模型进行向量转化、向量对齐、元素区分、元素关注和元素判断,检测确定目标锚点元素;步骤S4:记录目标元素与锚点元素之间的相对关系,用于机器人流程自动化运行时的目标元素定位;本发明通过网页截图、元素坐标和元素类别动态识别网页的锚点元素,具有适用范围广及识别可靠的优点。
技术关键词
元素 锚点 多模态 文本 坐标 BERT模型 非极大值抑制方法 Softmax函数 识别网页 图像 特征提取网络 机器人 注意力 关系 编码 对象 动态 模块
系统为您推荐了相关专利信息
1
一种生成点、线、面指定面积缓冲区的实验方法
多边形 面积计算公式 顶点 缓冲 坐标
2
一种客服服务业务处理方法、装置以及设备
自动语音应答系统 客服 语义 客户 关键词
3
瀑布流组件布局方法、装置、存储介质及计算机设备
组件布局方法 索引 模板组件 页面 样式
4
基座-转子轴系振动分析方法、存储介质及计算机设备
振动分析方法 转子 表达式 虚拟弹簧 坐标系
5
一种工业园区未知大气污染排放源的定位溯源方法
溯源方法 受体 工业园区 高斯扩散模型 风速
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号