一种基于混合专家的半监督方言情感语音合成系统

AITNT
正文
推荐专利
一种基于混合专家的半监督方言情感语音合成系统
申请号:CN202510778709
申请日期:2025-06-11
公开号:CN120299449A
公开日期:2025-07-11
类型:发明专利
摘要
本发明涉及方言语音合成,具体涉及一种基于混合专家的半监督方言情感语音合成系统,文本分析模块,对输入的方言文本进行预处理,并通过特征提取和特征融合生成文本表征向量;混合专家模块,获取方言声学特征、韵律特征、情感特征和通用声学特征;动态路由模块,通过任务感知型软路由算法实现专家之间的智能协作;半监督学习模块,利用带标注的方言情感语音数据对监督学习进行训练,同时利用未标注的方言情感语音数据对自监督学习进行训练;声学参数生成模块,对各专家的输出进行整合,生成完整的声学参数集合;神经声码器,将声学参数集合转换为最终的方言情感语音;本发明能够有效克服难以在样本资源匮乏的情况下精准合成方言情感语音的缺陷。
技术关键词
韵律特征 方言词汇 情感特征 文本 语音 声学特征 一维卷积神经网络 韵律模式 半监督学习 情感分类器 语义特征 声码器 通用特征 特征融合网络 注意力 参数 交互特征 智能协作 融合全局 感知损失函数
系统为您推荐了相关专利信息
1
基于多模态大模型和思维链的图文问答方法、设备及介质
问答方法 多模态 文本 图文 序列
2
一种实现PCB字符自动比对的工艺方法
PCB字符 文本识别 图像配准 深度学习算法 字母
3
计划管理方法、装置、电子设备和存储介质
计划管理方法 阶段 计划管理装置 文本 非暂态计算机可读存储介质
4
文生图模型的训练方法、图像生成方法、装置和介质
样本 文本 图文 策略 大语言模型
5
一种变电站联闭锁逻辑验证的方法及系统
联闭锁逻辑 功能约束数据 模糊匹配算法 自动化检测仪 变电站
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号