基于大模型的视觉语义融合的页面元素定位方法

正文

推荐专利

申请号：CN202510713864

申请日期：2025-05-30

公开号：CN120257213B

公开日期：2025-09-23

类型：发明专利

摘要

本发明提供一种基于大模型的视觉语义融合的页面元素定位方法，属于数据处理技术领域，具体包括：以不同的特征群组的特征与其它的页面元素的相似情况，确定特征群组中的可信特征群组，将页面元素在可信特征群组存在相似特征的其它的页面元素作为关联页面元素，以关联页面元素在可信特征群组中不同维度的特征与页面元素的相似情况，确定不同维度的特征在可信特征群组的置信度，确定不同的可信特征群组之间的关联页面元素的偏差情况，并结合不同维度的特征在所述可信特征群组的置信度，确定页面元素的定位处理方法，提升了定位处理的准确性。

技术关键词

页面元素定位方法动态页面识别偏差置信度阈值图像视觉特征数据处理技术语义特征指令基础

系统为您推荐了相关专利信息

一种用于自动语音识别推测解码的两阶段稀疏树预测方法

自动语音识别序列大语言模型置信度阈值文本

一种基于深度学习的专利价值评估方法与系统

指标价值评估方法文本价值评估系统标签

基于多模态信息的智能门控制方法、智能门及程序产品

智能门控制方法多模态传感器多模态信息电源切换电路人脸

面向小尺度的深度学习变化检测方法、装置、设备及介质

地物要素变化检测方法深度学习模型计算机可执行指令多尺度

UI自动化测试方法、装置、设备、介质、产品

页面结构图像分类模型元素 UI自动化测试标签

基于大模型的视觉语义融合的页面元素定位方法

站点导航

APP 下载