摘要
本发明提供一种基于人工智能的人机交互系统,涉及人机交互系统技术领域,包括,多模态数据采集单元,用于采集用户语音信号、面部图像及环境参数,并通过预设处理模块分别提取语音特征向量、视觉特征向量和环境特征向量,情感识别与用户画像单元,将每个所述特征向量拼接后输入联合卷积神经网络与自注意力编码器。该基于人工智能的人机交互系统,联合卷积神经网络再对拼接向量进行局部融合,进一步提取跨模态的细粒度特征;自注意力编码器能够捕捉不同通道之间的全局关联,使得融合隐状态向量同时兼顾语音细节、面部表情与环境上下文,从而使情感分类层能够获得更准确的情绪判别结果。
技术关键词
人机交互系统
注意力编码器
多模态数据采集
策略
画像
网络
语音特征提取
视觉特征提取
语音合成器
自然语言
参数
细粒度特征
梯度方法
特征提取模块
生成动作
在线
系统为您推荐了相关专利信息
钢丝螺套安装工装
钢丝螺套安装工具
安装系统
人机交互系统
拧紧机构
深度确定性策略梯度
轻量级神经网络
视觉SLAM技术
三维场景模型
协方差矩阵