摘要
本申请公开了用于防录音检测的语音识别唤醒方法、设备及系统,包括:采集当前音频,对当前音频中的多维度特征进行提取;基于提取的多维度特征,设定时间维度,将当前音频与历史真实语音在时间轴上进行对齐;基于对齐的当前音频与历史真实语音,构建多维度特征散点图;基于生成的对齐后音频的多维度散点图与历史真实语音的多维度散点图进行对比,计算综合相似度;设定相似度阈值并进行判断是否录音,当综合相似度数值高于设定阈值时,当前唤醒音频是真实的用户声音,反之是录音。通过构建历史散点环组特征组合和散点环组识别模型,能够更快速地识别当前唤醒音频是否真实,对于多段录音的拼接攻击具有更强的识别能力。
技术关键词
唤醒方法
语音
音频采集模块
性能监控
集成深度神经网络
对齐模块
高灵敏度麦克风
可视化模块
可视化工具
识别模块
唤醒设备
麦克风阵列
唤醒系统
采样点
特征提取模块
处理单元
特征值
异常事件
系统为您推荐了相关专利信息
三维人脸表情
智能体模型
语音特征
情绪特征
三维人脸动画
语音交互系统
大数据平台
语音采集模块
语音识别模块
语音唤醒模块