摘要
本发明涉及一种基于信号压缩的移动端情绪识别加速方法及系统,其中方法包括以下步骤:利用移动端设备采集语音信号并进行特征提取,利用Fbank编码器生成梅尔频谱图,压缩得到压缩特征;移动端设备将压缩特征发送给服务器;服务器对压缩特征进行还原,得到还原的梅尔频谱图,作为语音模态输入,并对还原的梅尔频谱图进行文本识别,得到文本信息,作为文本模态输入;服务器将语音模态输入和文本模态输入同时输入多模态深度学习网络中进行情绪识别,其中,多模态深度学习网络利用协同注意力模块实现语音模态输入和文本模态输入的融合。与现有技术相比,本发明具有计算和存储效率高、延迟低、识别结果精准等优点。
技术关键词
多模态深度学习
压缩特征
协同注意力
移动端
奇异值分解方法
服务器
文本识别
信号
融合特征
编码器
语音特征提取
矩阵
模块
深度学习网络
解码架构
系统为您推荐了相关专利信息
风险控制策略
深度学习技术
多元化策略
卫星图像数据
预测时间序列数据
关键帧
综合系统
比例模型
周期性
上存储计算机程序
液压支撑杆
人体外骨骼
外骨骼装置
腰部支撑结构
实时数据
教育大数据平台
电子教材
资源库
子模块
资源优化配置