摘要
提供了利用声学回声消除进行定向语音识别的方法、设备和系统。一种提供语音到文本转录的示例方法包括:在电子设备处接收来自多个传声器的多个通道的音频数据,其中,该多个通道的音频数据包括来自电子设备的用户的语音和来自一个或多个其他人的语音。该方法还包括:通过对该多个通道的音频数据应用多路径声学回声消除(AEC)技术来生成优化音频数据。该方法还包括:通过对优化音频数据应用波束成形来生成定向音频数据。该方法还包括:通过向自动语音识别器(ASR)输入定向音频数据,来识别来自电子设备的用户的语音和来自该一个或多个其他人的语音;以及生成对话的文本转录。
技术关键词
音频
声学回声消除
自动语音识别器
可读存储介质
线性滤波器
电子设备
数据
传声器
通道
计算机
多路径
文本
波束成形
扬声器
语音技术
短时傅立叶变换
可穿戴设备
系统为您推荐了相关专利信息
直流充电桩
风险评估方法
风险预测模型
数据
风险评估装置
数据格式
充电桩接口
对接平台
协议
应用程序编程接口
指令执行方法
计算机执行指令
标识
指令乱序执行
指令执行装置