摘要
本申请提供了一种基于发音信息引导的混合语音识别模型训练方法和基于发音信息引导的混合语音识别方法,包括:获取混合语音样本和混合语音样本的标签信息,混合语音样本的语言种类至少包括第一语言和第二语言,标签信息至少包括第一语言对应的第一文本、第一文本对应的发音、第二语言对应的第二文本、第二文本对应的发音;将混合语音样本输入到语音识别模型中,通过语音识别模型识别混合语音样本的预测结果,预测结果至少包括第一语言对应的第一预测文本、第一预测文本的第一预测发音、第二语言对应的第二预测文本和第二预测文本的第二预测发音;根据预测结果和标签信息,调整语音识别模型的参数。如此,能够精准识别混合语音的文本。
技术关键词
语音识别模型
混合语音识别方法
发音
文本
模型训练方法
声学特征
样本
大语言模型
解码器
标签
嵌入特征
投影器
模型训练装置
校正
采样器
分析模块
序列
参数
系统为您推荐了相关专利信息
变分自动编码器
图像解码器
文本编码器
图像编码器
样本
图像采集检测方法
图像采集定位装置
儿童
关键词
年龄