语音识别方法、装置、电子设备、存储介质和程序产品

正文

推荐专利

申请号：CN202510489152

申请日期：2025-04-17

公开号：CN120183406A

公开日期：2025-06-20

类型：发明专利

摘要

本公开涉及一种语音识别方法、装置、电子设备、存储介质和程序产品。该方法可以包括：获取待识别语音，其中，待识别语音包括唤醒语音和目标语音；将待识别语音输入至预先训练好的语音识别模型中，得到预测文本，预测文本为用于表征目标语音中目标用户的语音内容的文本，目标用户为唤醒语音的说话人；其中，语音识别模型包括语音编码器，语音编码器用于根据待识别语音，得到包括语义特征和说话人特征的第一特征向量，以确定预测文本。如此，在多说话人等声音嘈杂的场景下，能够精准地识别出目标语音中目标用户的语音内容。此外，利用单人语音对语音编码器进行自监督训练，能够有效降低对标注数据的依赖，增强模型泛化能力和适应性。

技术关键词

语音识别模型语音识别方法语音编码器样本单人文本大语言模型语义特征语音识别装置指令电子设备处理器计算机程序产品可读存储介质存储器数据模块

系统为您推荐了相关专利信息

面向视障人士的便携式智能设备实时盲文点检测方法与系统

盲文点检测方法面向视障人士便携式智能设备通道注意力机制对比度

一种人物形象图像生成方法和装置、电子设备及存储介质

语义特征融合特征偏好特征文本图像特征编码

一种表情可控的人脸视频风格编辑方法

风格编辑方法语音编码器人脸语音特征

一种基于模块化数据的物联网云监控系统

数据分析模型云监控系统监控设备数据分析模块数据采集模块

一种面向机坪管制的空管指令识别与航空器行为预警方法

航空器预警方法指令语义特征路段

语音识别方法、装置、电子设备、存储介质和程序产品

站点导航

APP 下载