基于特定情感的语音转换方法、装置、设备及存储介质

AITNT
正文
推荐专利
基于特定情感的语音转换方法、装置、设备及存储介质
申请号:CN202510293919
申请日期:2025-03-12
公开号:CN120126448A
公开日期:2025-06-10
类型:发明专利
摘要
本申请属于人工智能领域,可应用于医疗健康领域,涉及一种基于特定情感的语音转换方法,包括获取待转换文本,利用文本编码器提取所述待转换文本的内容特征;获取待转换风格,利用所述待转换风格从风格空间模块的风格空间中匹配出所述待转换风格的风格控制参数;将所述内容特征与所述风格控制参数,采用预定义的融合策略进行融合,得到融合信息;利用预先对抗性训练后的语音合成器对所述融合信息进行转换,得到所述待转换文本的目标语音波形。此外,本申请还涉及区块链技术,目标语音波形等可存储于区块链中。本申请能提高生成目标语音波形的准确率。
技术关键词
语音合成器 转换文本 语音转换方法 风格 文本编码器 空间模块 对抗性 融合策略 样本 数据 波形 语音转换装置 标签 前馈神经网络 计算机设备 处理器 医疗健康 区块链技术
系统为您推荐了相关专利信息
1
一种生成大语言模型的推理语料的方法和计算设备
表达式 生成自然语言 大语言模型 符号 有向无环图
2
基于跨模态对齐的弱监督扒渣终点判断方法和系统
跨模态 特征提取器 视觉特征 数据处理器 终点判断方法
3
一种基于记忆管理的多轮对话方法、装置及电子设备
话题 大语言模型 多轮对话方法 记忆管理 电子设备
4
一种印花图案的仿刺绣风格生成方法
刺绣图像 图像生成模型 融合注意力机制 代表 风格
5
基于视觉模型的轨道交通环境异物侵入检测方法及系统
文本特征向量 图像编码器 图像特征向量 异物侵入检测方法 轨道交通环境
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号