摘要
本发明公开了一种基于人机交互的AI智能投影仪,涉及投影仪技术领域,通过智能投影仪上的摄像头和麦克风分别采集用户的手势图像和语音音频,对采集到的手势图像和语音指令进行预处理,生成手势图像数据集语音指令数据集,再使用卷积神经网络CNN从手势图像数据集中提取手势特征,再通过全连接层进行分类,并将提取的手势特征传递给LSTM网络处理手势的时序信息,使用深度神经网络DNN从语音指令数据集中提取高级特征,通过Li brosa库提取梅尔频率倒谱系数MFCC识别语音指令,智能投影仪结合了手势识别和语音识别的功能,通过卷积神经网络和深度神经网络等模型实现对用户手势和语音指令的高效识别。
技术关键词
手势识别模型
语音识别模型
语音识别算法
人机交互算法
梅尔频率倒谱系数
手势识别算法
人机交互接口
手势特征
手势区域
识别语音指令
深度神经网络
智能投影仪系统
直方图均衡化图像
分析单元
数据采集单元
深度学习模型
系统为您推荐了相关专利信息
语音识别模型
声纹特征
语音识别模式
边缘算法
语音识别方法
手势识别模型
手势识别方法
二维卷积神经网络
回波
短时傅里叶变换
语音情感识别模型
智能语音助手系统
语音特征
特征提取模块
波动特征