一种用于语音识别的人机交互方法及系统

AITNT
正文
推荐专利
一种用于语音识别的人机交互方法及系统
申请号:CN202510961780
申请日期:2025-07-14
公开号:CN120496510B
公开日期:2025-09-19
类型:发明专利
摘要
本申请涉及数据处理技术领域,尤其涉及一种用于语音识别的人机交互方法及系统。方法包括:对目标时间段内的音频数据进行短时傅里叶变换获得频谱图,并对频谱图进行灰度化处理获得灰度图像;从灰度图像中筛选出多个目标横向区域;利用预设滑动窗口在灰度图像中滑动,从灰度图像的时间段中确定目标时域区间;从灰度图像中确定频率值位于预定基频范围内的初始频谱区域,并根据初始频谱区域、目标时域区间以及多个目标横向区域,确定人声所在的目标频谱区域,以根据目标频谱区域进行人机交互。通过以上技术方案,能够保证用户与电子设备进行语音交互的效率。
技术关键词
人机交互方法 图像 时间段 语音 人声 短时傅里叶变换 像素点 计算机程序指令 滑动窗口 音频 人机交互系统 数据处理技术 特征值 频率 存储器 处理器 电子设备 信号
系统为您推荐了相关专利信息
1
信息获取方法、装置、电子设备及计算机可读存储介质
信息获取方法 图像 模板 数据 可读存储介质
2
芯片、图像传输系统及车辆
图像传输系统 解串器 数据转换单元 电感电路 电容电路
3
基于动态传播社交图的多模态虚假新闻检测方法
邻居 节点 多模态 帖子 融合特征
4
一种导线覆冰体测量方法
测量方法 光照强度传感器 导线 对比度 彩色图像边缘
5
一种基于老年人仿真模型的二便障碍康复护理辅助系统
医学成像数据 动态磁共振成像 处理单元 采集单元 计算机断层扫描
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号