摘要
本申请实施例涉及一种控件定位模型训练方法、控件定位及触发方法、装置,上述训练方法包括:获取样本图文对和标注位置信息;利用初始控件定位模型包括的图像特征提取网络和文本特征提取网络,对样本图文对进行图像特征提取和文本特征提取,得到样本图像特征和样本文本特征;利用注意力特征提取网络,对样本图像特征和样本文本特征进行注意力特征提取,得到注意力特征;利用控件位置预测网络,对注意力特征进行控件位置预测,得到表示控件位置的预测位置信息;确定预测位置信息和标注位置信息之间的误差,训练得到控件定位模型。本申请实施例提高了模型对界面图像和文本的匹配精度,从而提高了图文匹配的场景适应性。
技术关键词
注意力
控件
特征提取网络
文本
图像特征提取
样本
图文
模型训练方法
融合特征
界面
误差
模型训练装置
存储计算机程序
语音
分类器
尺寸
识别模块
系统为您推荐了相关专利信息
情感分析模型
文本情感分析方法
语义特征提取
胶囊网络
注意力机制
数据库接口单元
贝叶斯算法
图像特征提取算法
数据采集模块
广度优先搜索算法
虚拟对象
信息处理方法
标识
距离信息
图形用户界面
编码特征
医学图像分割模型
阶段
医学图像分割方法
注意力