一种基于图像标记的网页导航系统及方法

AITNT
正文
推荐专利
一种基于图像标记的网页导航系统及方法
申请号:CN202411932276
申请日期:2024-12-26
公开号:CN119884518A
公开日期:2025-04-25
类型:发明专利
摘要
本申请公开了一种基于图像标记的网页导航系统及方法,系统包括:感知模型模块,用于:根据用户需求、历史操作与网页信息预测下一步操作;第一检查模块,用于:根据当前操作执行前、执行后的区域网页截图,利用MLLM判断当前操作的操作目的是否完成,是否需要补充操作;第二检查模块,用于:根据第一检查模块输出的结果以及历史操作,检查用户需求是否未完成。通过标记网页UI图像,缩减DOM树的内容,同时从不同阶段提升MLLM对于网页操作的理解,让网页导航智能体更高效、更精准地预测网页操作。
技术关键词
网页导航系统 网页元素 图像 网页导航方法 坐标 线框 多模态 模块 标记网页 像素 文本 图片 阶段
系统为您推荐了相关专利信息
1
一种用于工程施工巡检方法及系统
巡检现场 三维特征数据 无人机机体 巡检方法 图像
2
一种基于综合评估的自适应图像目标检测算法选择方法
图像处理方法 分组算法 资源 检测错误 融合策略
3
气体泄漏检测方法、装置、系统、设备、介质和程序产品
气体泄漏检测方法 图像分割模型 声源定位装置 定位点 气体泄漏点
4
施工现场全方位实时数据采集与管理平台
实时数据采集 施工现场数据 电子显示模块 无线传输模块 设备管理系统
5
一种基于人工智能技术与物联网技术的供热系统故障诊断方法
供热系统设备 供热设备 故障诊断方法 热图像 卷积模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号