摘要
本申请涉及数据处理技术领域,尤其涉及一种用于语音识别的人机交互方法及系统。方法包括:对目标时间段内的音频数据进行短时傅里叶变换获得频谱图,并对频谱图进行灰度化处理获得灰度图像;从灰度图像中筛选出多个目标横向区域;利用预设滑动窗口在灰度图像中滑动,从灰度图像的时间段中确定目标时域区间;从灰度图像中确定频率值位于预定基频范围内的初始频谱区域,并根据初始频谱区域、目标时域区间以及多个目标横向区域,确定人声所在的目标频谱区域,以根据目标频谱区域进行人机交互。通过以上技术方案,能够保证用户与电子设备进行语音交互的效率。
技术关键词
人机交互方法
图像
时间段
语音
人声
短时傅里叶变换
像素点
计算机程序指令
滑动窗口
音频
人机交互系统
数据处理技术
特征值
频率
存储器
处理器
电子设备
信号
系统为您推荐了相关专利信息
图像传输系统
解串器
数据转换单元
电感电路
电容电路
测量方法
光照强度传感器
导线
对比度
彩色图像边缘
医学成像数据
动态磁共振成像
处理单元
采集单元
计算机断层扫描