一种基于海量数据信息提取的语音唤醒方法和装置

正文

推荐专利

申请号：CN202510580966

申请日期：2025-05-07

公开号：CN120636380A

公开日期：2025-09-12

类型：发明专利

摘要

本发明提供了一种基于海量数据信息提取的语音唤醒方法和装置，方法包括从海量文本数据提取与唤醒词发音相似的候选词语构建关键词数据库，具体通过网络爬虫获取文本、Jieba分词、BERT+TextCNN模型筛选实现；把候选词语录制成音频与原始唤醒词音频混合成训练数据集，对其提取129维Fbank和Pitch融合特征；将融合特征输入基于注意力机制的端到端语音唤醒模型训练；实时采集音频，端点检测提取有效语音段，用训练后的模型输出唤醒概率，依概率阈值判定是否唤醒。本发明可以降低误唤醒率并提升唤醒率，改善语音唤醒交互体验。

技术关键词

语音唤醒方法语音唤醒模型语音唤醒装置海量文本数据焦点损失函数注意力机制语音特征提取融合特征关键词支持分布式计算音频 Softmax函数分词网络爬虫技术词语生成训练数据损失函数优化模型训练模块

一种基于海量数据信息提取的语音唤醒方法和装置

站点导航

APP 下载