控件定位模型训练方法、控件定位及触发方法、装置

正文

推荐专利

申请号：CN202410768436

申请日期：2024-06-14

公开号：CN118734244A

公开日期：2024-10-01

类型：发明专利

摘要

本申请实施例涉及一种控件定位模型训练方法、控件定位及触发方法、装置，上述训练方法包括：获取样本图文对和标注位置信息；利用初始控件定位模型包括的图像特征提取网络和文本特征提取网络，对样本图文对进行图像特征提取和文本特征提取，得到样本图像特征和样本文本特征；利用注意力特征提取网络，对样本图像特征和样本文本特征进行注意力特征提取，得到注意力特征；利用控件位置预测网络，对注意力特征进行控件位置预测，得到表示控件位置的预测位置信息；确定预测位置信息和标注位置信息之间的误差，训练得到控件定位模型。本申请实施例提高了模型对界面图像和文本的匹配精度，从而提高了图文匹配的场景适应性。

技术关键词

注意力控件特征提取网络文本图像特征提取样本图文模型训练方法融合特征界面误差模型训练装置存储计算机程序语音分类器尺寸识别模块

系统为您推荐了相关专利信息

一种文本情感分析方法、系统、设备及存储介质

情感分析模型文本情感分析方法语义特征提取胶囊网络注意力机制

基于人工智能的科普教育资源推荐系统

数据库接口单元贝叶斯算法图像特征提取算法数据采集模块广度优先搜索算法

生成式自监督预训练分类模型构建方法及装置

训练分类模型影像多源特征多光谱融合特征

一种游戏中的信息处理方法、程序产品与电子设备

虚拟对象信息处理方法标识距离信息图形用户界面

基于分层多尺度CNN-Transformer的医学图像分割方法及装置

编码特征医学图像分割模型阶段医学图像分割方法注意力

控件定位模型训练方法、控件定位及触发方法、装置

站点导航

APP 下载