摘要
本发明提供了基于人脸表情生成及推送音乐的智能音箱,包括音箱箱体和设置在音箱箱体内的控制板,音箱箱体上还设置有摄像头、第一喇叭、第二喇叭,摄像头和数位板分别与控制板连接,音箱箱体上还设置有电源接口,通过电源接口完成电能供给,在进行情绪识别时,利用摄像头捕捉人的上半身姿态和面部表情高清图片作为情绪识别模型的数据输入,模型提取出所需的数据特征并进行特征融合后,识别当前用户的情绪状态。本发明中的情绪识别模型使用并行的CNN编码器和Transformer编码器可以很好的结合数据的局部特征和全局特征,形成适合用户个性化识别算法,能够将用户的面部表情与音乐生成巧妙地结合在一起,增强了人机互动的趣味性和沉浸感。
技术关键词
情绪识别模型
智能音箱
人脸表情
音箱箱体
局部注意力机制
音乐
数位板
面部表情图片
电源接口
控制板
分支
输出特征
喇叭
多层感知机层
数据
面部表情识别
多头注意力机制
音频输出接口
系统为您推荐了相关专利信息
网络流量识别方法
多头注意力机制
网络流量数据
多层感知器
网络流量识别系统
温湿度检测模组
主控制电路板
温湿度传感器
显示屏组件
芯片
糖尿病性黄斑水肿
糖尿病视网膜病变
深度特征融合
联合诊断系统
病变特征
图像生成方法
局部注意力机制
文本
视觉
计算机指令集