多模态交互方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202410847026

申请日期：2024-06-27

公开号：CN118782044A

公开日期：2024-10-15

类型：发明专利

摘要

本发明涉及人机交互技术领域，提供一种多模态交互方法、装置、电子设备和存储介质，其中方法包括：接收车内的用户语音；对所述用户语音进行识别，得到识别文本，并对所述识别文本进行意图理解，获得意图信息；基于所述用户语音和/或所述意图信息，获取所述意图信息对应的图像，所述图像基于车内摄像头和/或车外摄像头采集得到；基于所述识别文本和所述图像，确定交互结果。本发明提供的方法、装置、电子设备和存储介质，通过将语音和视觉信息相融合，能够实现多模态交互，使得交互过程更加自然、准确、智能和灵活，从而大大提升用户的交互体验。

技术关键词

多模态交互方法意图图像车内摄像头文本语音视觉信息相融合非暂态计算机可读存储介质社交媒体电子设备视角车辆行驶状态人机交互技术处理器人脸风格移动终端

系统为您推荐了相关专利信息

基于无人机的棉花数据处理方法、装置以及电子设备

激光点云数据数字地表模型基因组变异数据基因敲除载体基因过表达载体

基于人工智能的智慧工地密闭空间作业监测与预警方法

姿态估计算法智慧工地关键点防护装备预警方法

一种基于红外温度图像的劣化绝缘子自动检测方法

复合绝缘子陶瓷绝缘子自动检测方法制冷红外热像仪循环神经网络模型

一种基于卫星遥感影像的红树林识别和面积变化分析方法、系统、设备、介质及产品

卫星遥感影像变化分析方法植被典型生态系统红树林信息

一种MDS显微数字成像处理方法及系统

数字成像栅格载玻片样本识别器

多模态交互方法、装置、电子设备和存储介质

站点导航

APP 下载