摘要
本申请实施例提供一种界面操作指令生成方法、电子设备、存储介质及程序产品。涉及人机交互领域、以及计算机视觉技术领域,该方法包括:基于操作界面的视觉特征,以及用户指令的当前语义特征,得到融合特征;依据融合特征,采用区域框回归模块,生成当前界面元素对应的目标区域框,当前界面元素为操作界面中可交互的元素,目标区域框用于表示当前界面元素的可交互区域,区域框回归模块为基于标注了参考区域框的参考界面元素训练得到的;生成基于目标区域框执行操作的操作指令。本申请实施例的技术方案中,本申请解决了相关技术中存在界面元素识别不准确,导致自动操作执行准确性不理想的技术问题。
技术关键词
指令生成方法
元素
融合特征
语义特征
操作界面
训练集
坐标
视觉特征
计算机视觉技术
模块
电子设备
可读存储介质
计算机程序产品
处理器
策略
存储器
系统为您推荐了相关专利信息
诊断方法
通道注意力机制
传动链
卷积特征提取
多传感器融合
水电站发电机
故障诊断方法
故障诊断模型
特征提取模块
融合特征
数据组织结构
电力系统模型
选配方法
遗传算法求解
选配系统
语义标签
异常数据检测方法
视觉特征
语义特征
图像
信息提取方法
文本
药物不良反应
特征值
大语言模型