基于发音信息引导的混合语音识别模型训练方法和基于发音信息引导的混合语音识别方法

AITNT
正文
推荐专利
基于发音信息引导的混合语音识别模型训练方法和基于发音信息引导的混合语音识别方法
申请号:CN202510851404
申请日期:2025-06-24
公开号:CN120636373A
公开日期:2025-09-12
类型:发明专利
摘要
本申请提供了一种基于发音信息引导的混合语音识别模型训练方法和基于发音信息引导的混合语音识别方法,包括:获取混合语音样本和混合语音样本的标签信息,混合语音样本的语言种类至少包括第一语言和第二语言,标签信息至少包括第一语言对应的第一文本、第一文本对应的发音、第二语言对应的第二文本、第二文本对应的发音;将混合语音样本输入到语音识别模型中,通过语音识别模型识别混合语音样本的预测结果,预测结果至少包括第一语言对应的第一预测文本、第一预测文本的第一预测发音、第二语言对应的第二预测文本和第二预测文本的第二预测发音;根据预测结果和标签信息,调整语音识别模型的参数。如此,能够精准识别混合语音的文本。
技术关键词
语音识别模型 混合语音识别方法 发音 文本 模型训练方法 声学特征 样本 大语言模型 解码器 标签 嵌入特征 投影器 模型训练装置 校正 采样器 分析模块 序列 参数
系统为您推荐了相关专利信息
1
一种跨模态交互补全的航空安全事件识别方法
变分自动编码器 图像解码器 文本编码器 图像编码器 样本
2
一种基于影像报告的异常疾病标签标注系统和方法
神经网络分类 标签标注方法 标注系统 报告 影像
3
一种建筑图像的生成方法、设备及介质
生成方法 版图 编码特征 文本 建筑
4
一种基于机器学习的金融交易风险评估方法、设备及介质
金融交易风险 指标 文本 数据 情绪特征
5
一种儿童骨龄图像采集定位装置及其检测方法
图像采集检测方法 图像采集定位装置 儿童 关键词 年龄
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号