一种语音克隆方法、语音克隆装置

AITNT
正文
推荐专利
一种语音克隆方法、语音克隆装置
申请号:CN202510981539
申请日期:2025-07-16
公开号:CN120726987A
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开了一种语音克隆方法、语音克隆装置,所述语音克隆方法包括:获取提示音频的提示文本,加载语音克隆推理引擎,生成第一克隆音频,对第一克隆音频评分:识别第一克隆音频得到识别文本,通过比对所述识别文本和所述评测文本;根据评分标准对所述第一克隆音频进行评分,进而判断所述第一克隆音频为通过或不通过;如果所述第一克隆音频为通过,则对用户输入的待合成文本热修复,获得修复文本;调用所述语音克隆推理引擎,根据所述提示文本和修复文本,合成第二克隆音频;通过对语音提示音频进行多维度评测来降低幻觉率、漏字率,通过热修复来提升可控性,通过引入缓存加速、模型加速等方法,提升语音克隆的使用体验。
技术关键词
克隆方法 文本 音频 语音识别模块 键值 符号 分词 解码器 编码器
系统为您推荐了相关专利信息
1
交互方法、装置、设备和存储介质
会话 界面 消息 呈现虚拟对象 交互方法
2
一种病例分析方法、装置、设备、存储介质及程序产品
医学模型 文本特征向量 分析方法 关键词 集群
3
一种代码生成方法、装置、设备及存储介质
代码生成方法 模型库 功能模块 模板 自定义规则
4
基于大模型的DRG智能分组方法及系统
编码特征 智能分组方法 自然语言文本 摘要 语义
5
攻击组织和分布式测绘行为识别方法、设备和介质
识别方法 关联规则算法 置信度阈值 数据项 组织
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号