一种语音转换方法、存储介质、电子设备及程序产品

AITNT
正文
推荐专利
一种语音转换方法、存储介质、电子设备及程序产品
申请号:CN202410918937
申请日期:2024-07-09
公开号:CN118675511A
公开日期:2024-09-20
类型:发明专利
摘要
本申请提供一种语音转换方法、存储介质、电子设备及程序产品。涉及人工智能技术领域。本申请在进行语音转换时,可以先确定反应源语音语义内容的多维聚类情况的离散目标标签,使源语音的语义编码特征反应源语音的关键语义信息而不包含音色信息。从而使语音转换模型可以直接基于分离的语义特征与音色特征进行语音转换。基于上述转换过程,本申请创造性地将语音转换模型配置为根据样本语音基于样本自身音色的重建情况训练的机器学习模型。即前述语音转换模型在训练时可以直接基于样本语音进行重建并基于重建情况与实际情况的差异进行参数迭代,以使模型的训练数据无需进行人工标注,整个训练过程可以无监督进行。
技术关键词
语音转换方法 编码特征 后验特征 样本 编码器 机器学习模型 电子设备 指令处理器 解码器 波形 文本 音色特征 可读存储介质 人工智能技术 标签 计算机程序产品 语义
系统为您推荐了相关专利信息
1
身份识别的方法、装置、电子设备及存储介质
生物 身份 特征值 森林模型 决策树模型
2
模型训练方法和病变图像分割方法及装置
图像分割网络 模型训练方法 图像分割方法 编码特征 编码器
3
一种密集通道输电线路故障的智能视觉与状态感知协同隐患监测方法及系统
输电线路故障 风险评估模型 监测方法 单目摄像头 动态卷积网络
4
一种基于服装生产智能制造的MES系统
子模块 决策树桩 服务器模块 阶段 样本收集单元
5
一种针对专业领域的跨模态图文检索方法
适配器 图文检索方法 节点 微调技术 专业
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号