摘要
本发明提供一种基于大模型的视觉语义融合的页面元素定位方法,属于数据处理技术领域,具体包括:以不同的特征群组的特征与其它的页面元素的相似情况,确定特征群组中的可信特征群组,将页面元素在可信特征群组存在相似特征的其它的页面元素作为关联页面元素,以关联页面元素在可信特征群组中不同维度的特征与页面元素的相似情况,确定不同维度的特征在可信特征群组的置信度,确定不同的可信特征群组之间的关联页面元素的偏差情况,并结合不同维度的特征在所述可信特征群组的置信度,确定页面元素的定位处理方法,提升了定位处理的准确性。
技术关键词
页面元素定位方法
动态页面
识别偏差
置信度阈值
图像视觉特征
数据处理技术
语义特征
指令
基础
系统为您推荐了相关专利信息
智能门控制方法
多模态传感器
多模态信息
电源切换电路
人脸
地物要素
变化检测方法
深度学习模型
计算机可执行指令
多尺度
页面结构
图像分类模型
元素
UI自动化测试
标签