基于图文标识识别的控制方法及装置

AITNT
正文
推荐专利
基于图文标识识别的控制方法及装置
申请号:CN202510665443
申请日期:2025-05-21
公开号:CN120599591A
公开日期:2025-09-05
类型:发明专利
摘要
本申请公开了一种基于图文标识识别的控制方法及装置。该方法包括:获取当前场景的场景图像;将场景图像输入YOLO模型,以获取场景图像中的标识对象的局部区域图像以及标识对象在场景图像中的坐标;将局部区域图像输入MobileFaceNet模型,以获取标识对象的图文标识内容的识别结果,图文标识内容包括字符或图形标识中的至少一种;以及基于标识对象的图文标识内容的识别结果和标识对象在场景图像中的坐标,在当前场景执行操作。
技术关键词
计算机可执行指令 YOLO模型 标识 图文 场景 注意力机制 卷积模块 图像 对象 处理器 计算机程序产品 坐标 面部识别 字符 优化器 可读存储介质 移动端 存储器
系统为您推荐了相关专利信息
1
一种基于车网互动的电动汽车反向充电方法、设备及介质
反向充电方法 供电车辆 电池状态信息 LLC谐振转换器 非易失性计算机存储介质
2
一种基于车路协同的交通风险识别方法和装置
移动物体 显示信息 智慧城市交通系统 风险识别方法 虚拟设备
3
一种基于视觉语言模型和动态场景的危险环境识别方法
环境识别方法 动态场景 逻辑 语义角色标注 区域运动矢量
4
基于模糊动态序列贝叶斯网络的空间群目标意图识别方法
意图识别方法 意图识别模型 隶属度函数 序列 场景
5
一种文旅场景下基于大语言模型的多角色助手系统及装置
大语言模型 助手系统 交通数据平台 预订平台 公共安全监测系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号