一种模型训练以及页面检测方法、装置、介质及设备

AITNT
正文
推荐专利
一种模型训练以及页面检测方法、装置、介质及设备
申请号:CN202411535888
申请日期:2024-10-30
公开号:CN119046174B
公开日期:2025-05-16
类型:发明专利
摘要
本说明书公开了一种模型训练以及页面检测方法、装置、介质及设备。获取样本页面图像,样本页面图像对应的导航文本以及标签文本。将样本页面图像与导航文本输入到预设的大语言模型,以使大语言模型根据导航文本,确定输出文本,输出文本中包含有目标控件在页面中所在位置的预测坐标表征。将预测坐标表征输入到待训练的坐标解码器,得到目标控件在页面中所在位置的预测坐标。根据预测坐标与实际页面坐标之间的差异,确定综合损失值,以根据综合损失值,对坐标解码器进行训练。使得训练完成的坐标解码器能够对大语言模型输出的预测坐标表征进行纠正,提高页面检测准确性。
技术关键词
坐标 解码器 标签文本 页面检测方法 大语言模型 多层感知机 控件 文本编码器 样本 图像编码器 页面检测装置 模型训练装置 模型训练方法 数据获取模块 数据解码 处理器
系统为您推荐了相关专利信息
1
一种三维测量系统的测量视点分布规划方法
关键特征点 待测零件 规划 邻域 点云数据处理
2
一种多径识别方法及其相关设备
雷达点云数据 密度聚类算法 识别方法 AdaBoost算法 计算机程序指令
3
一种基于距离多普勒图的雷达抗主瓣干扰动目标检测方法
注意力 上采样 编码器模块 多普勒 特征选择
4
一种基于全局几何先验的半监督医学图像分割方法及装置
医学图像分割方法 交互特征 图像分割模型 编码特征 分割医学图像
5
一种基于抗噪对比损失的多模态目标识别方法
特征提取网络 识别方法 编码器架构 解码器架构 模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号