基于大模型的视觉语义融合的页面元素定位方法

AITNT
正文
推荐专利
基于大模型的视觉语义融合的页面元素定位方法
申请号:CN202510713864
申请日期:2025-05-30
公开号:CN120257213B
公开日期:2025-09-23
类型:发明专利
摘要
本发明提供一种基于大模型的视觉语义融合的页面元素定位方法,属于数据处理技术领域,具体包括:以不同的特征群组的特征与其它的页面元素的相似情况,确定特征群组中的可信特征群组,将页面元素在可信特征群组存在相似特征的其它的页面元素作为关联页面元素,以关联页面元素在可信特征群组中不同维度的特征与页面元素的相似情况,确定不同维度的特征在可信特征群组的置信度,确定不同的可信特征群组之间的关联页面元素的偏差情况,并结合不同维度的特征在所述可信特征群组的置信度,确定页面元素的定位处理方法,提升了定位处理的准确性。
技术关键词
页面元素定位方法 动态页面 识别偏差 置信度阈值 图像视觉特征 数据处理技术 语义特征 指令 基础
系统为您推荐了相关专利信息
1
一种用于自动语音识别推测解码的两阶段稀疏树预测方法
自动语音识别 序列 大语言模型 置信度阈值 文本
2
一种基于深度学习的专利价值评估方法与系统
指标 价值评估方法 文本 价值评估系统 标签
3
基于多模态信息的智能门控制方法、智能门及程序产品
智能门控制方法 多模态传感器 多模态信息 电源切换电路 人脸
4
面向小尺度的深度学习变化检测方法、装置、设备及介质
地物要素 变化检测方法 深度学习模型 计算机可执行指令 多尺度
5
UI自动化测试方法、装置、设备、介质、产品
页面结构 图像分类模型 元素 UI自动化测试 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号