摘要
本发明公开了一种语音空调的控制方法、装置、语音空调及介质。本发明涉及空调技术领域,方法包括:获取方言指令对应的方言语音及口型视频;对所述方言语音进行处理得到声学特征,对所述口型视频进行处理得到视觉特征;将所述声学特征和所述视觉特征进行融合得到多模态特征;获取环境数据,并根据所述环境数据确定活动场景;根据所述多模态特征、所述活动场景以及预置的方言指令库判断是否根据所述方言指令对语音空调进行控制。本发明先将方言指令对应的方言语音和口型视频的特征进行融合得到多模态特征,再根据多模态特征、环境数据确定的活动场景以及预置的方言指令库对语音空调进行控制,提高了语音空调识别方言的准确率。
技术关键词
语音空调
多模态特征
视觉特征
声学特征
指令
视频
音频特征提取方法
深度神经网络方法
轻量级神经网络
场景分类
嵌入特征
语音活动检测
时序依赖关系
识别方言
深度学习算法
数据
决策树模型