一种多模态融合全息影像的AI交互系统及方法

正文

推荐专利

申请号：CN202510760199

申请日期：2025-06-09

公开号：CN120610629A

公开日期：2025-09-09

类型：发明专利

摘要

本申请涉及一种多模态融合全息影像的AI交互系统及方法。包括：语音交互模块，将获取的用户的语音利用预设的SR自动语音识别技术转换为文本，并通过预设的TTS语音合成技术针对转换后的文本生成自然语音回复；图像识别模块，基于预设的深度学习模型识别用户的输入图像中的动植物种类、场景特征或目标物体；AR/VR模块，用于通过增强现实或虚拟现实技术将虚拟信息与图像识别模块中的现实场景融合，生成可交互的三维场景；数据融合引擎，用于对各交互模块的数据进行整合分析，生成协同响应策略。本发明通过多模态融合与全息影像技术，实现交互方式自然切换、信息高效立体传递及全场景自适应，显著提升复杂场景下的人机交互体验与任务完成效率。

技术关键词

图像识别模块语音交互模块自动语音识别技术现实场景融合多模态交互系统虚拟现实技术自然语音深度学习模型全息影像技术场景特征全息投影技术文本人机交互体验动作控制器图像特征提取影像模块

系统为您推荐了相关专利信息

基于多模态数据融合的孕产妇静脉血栓栓塞症动态风险评估系统及其方法

动态风险评估系统静脉血栓栓塞多模态数据融合长短期记忆网络云端数据处理

一种多模态柔性挡土墙变形基坑开挖模拟试验装置及方法

柔性挡土墙基坑开挖模拟位移电机试验装置土压力传感器

一种智能会议多模态协同控制与智能处理的方法

会议一体机多模态协同生成会议纪要多人人脸识别平台

基于智能感知的钛合金构件增材制造过程缺陷在线识别与实时反馈的闭环自调节方法

钛合金构件闭环光谱传感器红外热像仪多模态传感器

适应多模态电网项目群特征的投资执行监测方法及系统

执行监测方法项目指标风险随机森林模型

一种多模态融合全息影像的AI交互系统及方法

站点导航

APP 下载