AI眼镜的多模态交互和图像处理方法、电子设备和存储介质

正文

推荐专利

申请号：CN202510284292

申请日期：2025-03-11

公开号：CN119785165B

公开日期：2025-06-17

类型：发明专利

摘要

本发明提供了一种AI眼镜的多模态交互和图像处理方法、电子设备和存储介质，包括：基于时空注意力机制对AI眼镜实时采集的原始图像进行预处理，得到预处理图像；对用户通过AI眼镜输入的语音指令进行语音识别与语义解析，得到文本指令；将文本指令与预设的图像处理指令模板库进行关键词匹配，确定对应的图像处理策略；若图像处理策略为动态追踪，利用卡尔曼滤波算法预测预处理图像中的目标在下一帧的位置，利用孪生网络在预测的位置周边搜索，定位所述目标；基于孪生网络实时学习更新目标的外观特征，实现对目标的稳定追踪并输出追踪目标图像序列。在本发明中，克服了当前无法预测目标的后续出现位置，以及无法稳定追踪目标的缺陷。

技术关键词

AI眼镜多模态交互时空注意力机制图像处理方法卡尔曼滤波算法字符搜索特征语音指令三维卷积神经网络关键字序列信息编码局部细节特征动态变化特征文本

系统为您推荐了相关专利信息

一种建筑设备的故障定位方法、装置、设备及介质

建筑信息模型故障定位方法建筑设备时空注意力机制巡检路径

无通信互联的多构网型储能变流器协同自主同步构网方法

储能变流器构网方法虚拟同步机虚拟惯量卡尔曼滤波算法

一种应对复杂扰动的水下机器人动力定位方法

动力定位方法水下机器人扰动观测器推进器双目相机

一种石油设备运行安全监控方法

安全监控方法石油设备光纤振动传感器卡尔曼滤波算法时间序列分析技术

基于多特征参数全局联动调整的人像图像处理方法

多特征参数图像处理方法风格人脸检测区域图像采集模块

AI眼镜的多模态交互和图像处理方法、电子设备和存储介质

站点导航

APP 下载