一种基于人机交互的AI智能投影仪

AITNT
正文
推荐专利
一种基于人机交互的AI智能投影仪
申请号:CN202410871165
申请日期:2024-07-01
公开号:CN118796038A
公开日期:2024-10-18
类型:发明专利
摘要
本发明公开了一种基于人机交互的AI智能投影仪,涉及投影仪技术领域,通过智能投影仪上的摄像头和麦克风分别采集用户的手势图像和语音音频,对采集到的手势图像和语音指令进行预处理,生成手势图像数据集语音指令数据集,再使用卷积神经网络CNN从手势图像数据集中提取手势特征,再通过全连接层进行分类,并将提取的手势特征传递给LSTM网络处理手势的时序信息,使用深度神经网络DNN从语音指令数据集中提取高级特征,通过Li brosa库提取梅尔频率倒谱系数MFCC识别语音指令,智能投影仪结合了手势识别和语音识别的功能,通过卷积神经网络和深度神经网络等模型实现对用户手势和语音指令的高效识别。
技术关键词
手势识别模型 语音识别模型 语音识别算法 人机交互算法 梅尔频率倒谱系数 手势识别算法 人机交互接口 手势特征 手势区域 识别语音指令 深度神经网络 智能投影仪系统 直方图均衡化图像 分析单元 数据采集单元 深度学习模型
系统为您推荐了相关专利信息
1
一种基于边缘算法的多种语音识别方法及系统
语音识别模型 声纹特征 语音识别模式 边缘算法 语音识别方法
2
一种基于毫米波雷达的手势识别方法及系统
手势识别模型 手势识别方法 二维卷积神经网络 回波 短时傅里叶变换
3
音频理解模型的训练方法、音频理解方法、装置、存储介质和程序产品
模型主体 编码模块 音频 语音识别模型 声学特征
4
一种基于语音情感识别的响应方法及智能语音助手系统
语音情感识别模型 智能语音助手系统 语音特征 特征提取模块 波动特征
5
一种决策生成辅助方法、装置、设备及存储介质
决策 文本 语音识别模型 网络优化结构 网络结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号