摘要
本公开涉及一种语音识别方法、装置、电子设备、存储介质和程序产品。该方法可以包括:获取待识别语音,其中,待识别语音包括唤醒语音和目标语音;将待识别语音输入至预先训练好的语音识别模型中,得到预测文本,预测文本为用于表征目标语音中目标用户的语音内容的文本,目标用户为唤醒语音的说话人;其中,语音识别模型包括语音编码器,语音编码器用于根据待识别语音,得到包括语义特征和说话人特征的第一特征向量,以确定预测文本。如此,在多说话人等声音嘈杂的场景下,能够精准地识别出目标语音中目标用户的语音内容。此外,利用单人语音对语音编码器进行自监督训练,能够有效降低对标注数据的依赖,增强模型泛化能力和适应性。
技术关键词
语音识别模型
语音识别方法
语音编码器
样本
单人
文本
大语言模型
语义特征
语音识别装置
指令
电子设备
处理器
计算机程序产品
可读存储介质
存储器
数据
模块
系统为您推荐了相关专利信息
盲文点检测方法
面向视障人士
便携式智能设备
通道注意力机制
对比度
数据分析模型
云监控系统
监控设备
数据分析模块
数据采集模块