一种用于语音识别的人机交互方法及系统

正文

推荐专利

一种用于语音识别的人机交互方法及系统

申请号：CN202510961780

申请日期：2025-07-14

公开号：CN120496510B

公开日期：2025-09-19

类型：发明专利

摘要

本申请涉及数据处理技术领域，尤其涉及一种用于语音识别的人机交互方法及系统。方法包括：对目标时间段内的音频数据进行短时傅里叶变换获得频谱图，并对频谱图进行灰度化处理获得灰度图像；从灰度图像中筛选出多个目标横向区域；利用预设滑动窗口在灰度图像中滑动，从灰度图像的时间段中确定目标时域区间；从灰度图像中确定频率值位于预定基频范围内的初始频谱区域，并根据初始频谱区域、目标时域区间以及多个目标横向区域，确定人声所在的目标频谱区域，以根据目标频谱区域进行人机交互。通过以上技术方案，能够保证用户与电子设备进行语音交互的效率。

技术关键词

人机交互方法图像时间段语音人声短时傅里叶变换像素点计算机程序指令滑动窗口音频人机交互系统数据处理技术特征值频率存储器处理器电子设备信号

系统为您推荐了相关专利信息

信息获取方法、装置、电子设备及计算机可读存储介质

信息获取方法图像模板数据可读存储介质

芯片、图像传输系统及车辆

图像传输系统解串器数据转换单元电感电路电容电路

基于动态传播社交图的多模态虚假新闻检测方法

邻居节点多模态帖子融合特征

一种导线覆冰体测量方法

测量方法光照强度传感器导线对比度彩色图像边缘

一种基于老年人仿真模型的二便障碍康复护理辅助系统

医学成像数据动态磁共振成像处理单元采集单元计算机断层扫描

一种用于语音识别的人机交互方法及系统

站点导航

APP 下载