基于人工智能的机器人多模态交互方法和系统

正文

推荐专利

申请号：CN202510794150

申请日期：2025-06-13

公开号：CN120704521A

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种基于人工智能的机器人多模态交互方法和系统，其属于人工智能技术领域，包括采集并预处理初始多模态数据，得到多模态数据，将多模态数据输入卷积神经网络，并对多模态数据进行处理和解析，得到图像特征向量、手势特征向量、第一概率分布、语音特征向量、第二概率分布、文本特征向量和第三概率分布，提取语义信息，得到综合语义信息；对图像数据和手势数据进行手势识别，得到识别结果，将上述数据进行融合，得到综合语义表达；根据综合语义表达匹配预设的交互策略，得到交互信息。本发明能充分融合RGB图像和深度图像，使图像具有清晰完整的形状和轮廓，同时通过融合图像数据、语音数据和文字数据，提升交互信息的准确性。

技术关键词

多模态交互方法综合语义文本特征向量图像特征向量双流卷积神经网络语音手势特征多级特征融合机器人图像增强手势传感器多模态交互系统触摸传感器融合图像数据

系统为您推荐了相关专利信息

一种向量式图像与视频检索方法

视频检索方法视频特征向量图像特征向量查询标签视频关键帧提取

一种基于大模型的泊位检测系统及方法

泊位连通体文本特征向量线框图像特征向量

一种语义驱动的云盘静态负载预测方法和系统

负载预测方法未来负载预测矩阵样本特征选择

标签相关性引导的多模态下水道共生病害识别方法

病害识别方法病害识别系统下水道标签学生

视频摘要生成方法、电子设备、存储介质及程序产品

语义主题视频帧融合特征视频摘要生成方法语义特征提取

基于人工智能的机器人多模态交互方法和系统

站点导航

APP 下载