基于图文标识识别的控制方法及装置

正文

推荐专利

基于图文标识识别的控制方法及装置

申请号：CN202510665443

申请日期：2025-05-21

公开号：CN120599591A

公开日期：2025-09-05

类型：发明专利

摘要

本申请公开了一种基于图文标识识别的控制方法及装置。该方法包括：获取当前场景的场景图像；将场景图像输入YOLO模型，以获取场景图像中的标识对象的局部区域图像以及标识对象在场景图像中的坐标；将局部区域图像输入MobileFaceNet模型，以获取标识对象的图文标识内容的识别结果，图文标识内容包括字符或图形标识中的至少一种；以及基于标识对象的图文标识内容的识别结果和标识对象在场景图像中的坐标，在当前场景执行操作。

技术关键词

计算机可执行指令 YOLO模型标识图文场景注意力机制卷积模块图像对象处理器计算机程序产品坐标面部识别字符优化器可读存储介质移动端存储器

系统为您推荐了相关专利信息

一种基于车网互动的电动汽车反向充电方法、设备及介质

反向充电方法供电车辆电池状态信息 LLC谐振转换器非易失性计算机存储介质

一种基于车路协同的交通风险识别方法和装置

移动物体显示信息智慧城市交通系统风险识别方法虚拟设备

一种基于视觉语言模型和动态场景的危险环境识别方法

环境识别方法动态场景逻辑语义角色标注区域运动矢量

基于模糊动态序列贝叶斯网络的空间群目标意图识别方法

意图识别方法意图识别模型隶属度函数序列场景

一种文旅场景下基于大语言模型的多角色助手系统及装置

大语言模型助手系统交通数据平台预订平台公共安全监测系统

基于图文标识识别的控制方法及装置

站点导航

APP 下载