控件定位模型训练方法、控件定位及触发方法、装置

AITNT
正文
推荐专利
控件定位模型训练方法、控件定位及触发方法、装置
申请号:CN202410768436
申请日期:2024-06-14
公开号:CN118734244A
公开日期:2024-10-01
类型:发明专利
摘要
本申请实施例涉及一种控件定位模型训练方法、控件定位及触发方法、装置,上述训练方法包括:获取样本图文对和标注位置信息;利用初始控件定位模型包括的图像特征提取网络和文本特征提取网络,对样本图文对进行图像特征提取和文本特征提取,得到样本图像特征和样本文本特征;利用注意力特征提取网络,对样本图像特征和样本文本特征进行注意力特征提取,得到注意力特征;利用控件位置预测网络,对注意力特征进行控件位置预测,得到表示控件位置的预测位置信息;确定预测位置信息和标注位置信息之间的误差,训练得到控件定位模型。本申请实施例提高了模型对界面图像和文本的匹配精度,从而提高了图文匹配的场景适应性。
技术关键词
注意力 控件 特征提取网络 文本 图像特征提取 样本 图文 模型训练方法 融合特征 界面 误差 模型训练装置 存储计算机程序 语音 分类器 尺寸 识别模块
系统为您推荐了相关专利信息
1
一种文本情感分析方法、系统、设备及存储介质
情感分析模型 文本情感分析方法 语义特征提取 胶囊网络 注意力机制
2
基于人工智能的科普教育资源推荐系统
数据库接口单元 贝叶斯算法 图像特征提取算法 数据采集模块 广度优先搜索算法
3
生成式自监督预训练分类模型构建方法及装置
训练分类模型 影像 多源特征 多光谱 融合特征
4
一种游戏中的信息处理方法、程序产品与电子设备
虚拟对象 信息处理方法 标识 距离信息 图形用户界面
5
基于分层多尺度CNN-Transformer的医学图像分割方法及装置
编码特征 医学图像分割模型 阶段 医学图像分割方法 注意力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号