摘要
本申请公开了一种基于图文标识识别的控制方法及装置。该方法包括:获取当前场景的场景图像;将场景图像输入YOLO模型,以获取场景图像中的标识对象的局部区域图像以及标识对象在场景图像中的坐标;将局部区域图像输入MobileFaceNet模型,以获取标识对象的图文标识内容的识别结果,图文标识内容包括字符或图形标识中的至少一种;以及基于标识对象的图文标识内容的识别结果和标识对象在场景图像中的坐标,在当前场景执行操作。
技术关键词
计算机可执行指令
YOLO模型
标识
图文
场景
注意力机制
卷积模块
图像
对象
处理器
计算机程序产品
坐标
面部识别
字符
优化器
可读存储介质
移动端
存储器
系统为您推荐了相关专利信息
反向充电方法
供电车辆
电池状态信息
LLC谐振转换器
非易失性计算机存储介质
移动物体
显示信息
智慧城市交通系统
风险识别方法
虚拟设备
环境识别方法
动态场景
逻辑
语义角色标注
区域运动矢量
意图识别方法
意图识别模型
隶属度函数
序列
场景
大语言模型
助手系统
交通数据平台
预订平台
公共安全监测系统