语音唤醒及模型训练方法、装置、相关设备及程序产品

正文

推荐专利

申请号：CN202510532285

申请日期：2025-04-25

公开号：CN120220647A

公开日期：2025-06-27

类型：发明专利

摘要

本申请公开了一种语音唤醒及模型训练方法、装置、相关设备及程序产品，在训练语音唤醒模型时所采用的第一训练数据同时包含了本地录制音频及第一合成音频，该第一合成音频是基于本地录制音频的声纹特征，及第一文本所合成的音频。本申请仅需收集少量的真实用户录制音频用于提取声纹特征，即可合成第一文本的音频，降低了人工录制音频的成本，合成音频是以本地录制音频的声纹特征作为指导，使得合成音频更贴近于真实用户的录制音频，第一训练数据可以覆盖更多的地方口音和个人说话风格。第一文本覆盖语音唤醒模型的使用场景下的完备说法，保证合成音频可以覆盖完备说法，提升了训练后的语音唤醒模型的唤醒效果。

技术关键词

语音唤醒模型声纹特征音频语音唤醒方法文本模型训练方法合成器数据获取单元计算机程序产品处理器训练装置场景可读存储介质存储器电子设备风格

系统为您推荐了相关专利信息

基于上下文感知的文本情感判别方法、系统、设备及介质

情感判别方法文本记忆单元情感类别样本

一种喇叭温度防护电路及喇叭装置

音频信号输出电路温度保险丝防护电路信号线音频信号输入电路

一种基于多模态对齐的智能心理状态评估方法及系统

心理状态评估方法心理状态分析文本多模态交叉注意力机制

一种引入稠密向量检索器的大语言模型的处理方法和装置

大语言模型标签文本特征提取模块文本特征向量字段

一种终端设备及媒资的生成方法

终端设备混合蛙跳算法局部搜索算法指标模拟退火算法

语音唤醒及模型训练方法、装置、相关设备及程序产品

站点导航

APP 下载