一种语音模型训练方法、装置、存储介质及电子设备

AITNT
正文
推荐专利
一种语音模型训练方法、装置、存储介质及电子设备
申请号:CN202410853569
申请日期:2024-06-27
公开号:CN118969016A
公开日期:2024-11-15
类型:发明专利
摘要
本说明书实施例公开了一种语音模型训练方法、装置、存储介质及电子设备,首先分别利用语音模型和文本模型对训练样本集中的训练样本进行特征提取,得到训练样本对应的样本音频特征和样本文本特征;然后根据训练样本集中训练样本的样本音频特征和样本音频的音频类别信息,生成分类损失值,分类损失值表征音频类别信息和实际类别信息之间的差异;然后根据训练样本集中训练样本的样本音频特征和样本文本特征,生成相似度损失值,相似度损失值表征样本音频特征和样本文本特征之间的相似度;最后根据分类损失值和相似度损失值,调整语音模型和文本模型的参数。
技术关键词
音频特征 样本 文本 语音模型训练方法 三元组 音频识别方法 分类网络 融合特征 模型训练装置 参数 电子设备 特征提取模块 计算机程序产品 处理器 存储器 标识
系统为您推荐了相关专利信息
1
一种基于多模态数据的电梯安全风险预警方法
电梯机械部件 长短期记忆网络 风险预警方法 电梯传感器 电梯轿厢
2
一种基于AI的视频生成平台
生成平台 生成对抗网络 计算机视觉算法 视频输出模块 版权
3
歌词显示方法、设备、存储介质及程序产品
文本 歌词显示方法 人工智能AI模型 歌词文件 样式
4
基于神经网络算法的包装机空头检测点检行为判断方法
卷积神经网络模型 判断方法 包装机 样本 神经网络算法模型
5
一种业务流程的优化方法及相关装置
指标 机器学习模型 样本 异常数据点 计算机可读指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号