摘要
本发明公开一种面向智能座舱的实时情绪感知与语音交互系统,包括:多模态数据采集模块用于同步采集驾驶员的面部图像、语音信号及文本输入;视觉特征增强单元用于对低质量图像进行修复与情绪分布提取;音频降噪与特征提取单元用于提取语音情绪特征;文本情绪编码单元用于融合相对位置编码与上下文语义信息;跨模态融合模块,用于通过整合视觉、音频与文本特征输出情绪分类结果;个性化情绪数据库,用于存储用户历史情绪数据并进行情绪趋势预测与预警判断;大语言模型反馈模块,根据情绪识别结果与驾驶情境生成结构化提示词生成自然语言反馈;语音合成与输出模块用于调整语音参数并通过车载多通道进行反馈输出;本发明增强人车交互的情感表达力。
技术关键词
语音交互系统
跨模态
上下文语义信息
车载多通道
多模态数据采集
生成自然语言
语音交互方法
情绪特征
大语言模型
视觉特征
特征提取单元
融合多模态特征
文本
智能座舱系统
音频
短时傅里叶变换
车载扬声器
模块
系统为您推荐了相关专利信息
智能驾驶方法
高层语义信息
车载激光雷达
车辆行驶路径
语义标签