一种语音生成方法、设备、存储介质及程序产品

AITNT
正文
推荐专利
一种语音生成方法、设备、存储介质及程序产品
申请号:CN202411909219
申请日期:2024-12-23
公开号:CN119694293A
公开日期:2025-03-25
类型:发明专利
摘要
本申请实施例提供一种语音生成方法、设备、存储介质及程序产品。在该方法中,可获取文本,将模型提示词和文本输入到标签生成模型,在模型提示词的引导下,生成多个文本片段的语音参数标签;将多个文本片段以及各自的语音参数标签输入语音生成模型,基于多个文本片段以及各自的语音参数标签生成多个目标语音片段,从而拼接得到文本对应的目标语音。通过这种方式,可基于标签生成模型和模型提示词较为准确地生成文本片段的语音参数标签,并基于语音生成模型和语音参数标签较为准确地进行语音生成,生成的目标语音的每个语音片段具有语音参数标签要求的语速、音量和/或停顿时长,因而更加自然,与文本的适配度更高。
技术关键词
文本 语音生成模型 语音生成方法 参数 语义特征 独立语义 标签特征 处理器 表情特征 计算机程序产品 分段 指令 标记 面部 可读存储介质 终端设备
系统为您推荐了相关专利信息
1
一种识别地表特征变化的方法、装置、设备和存储介质
时序遥感数据 预训练语言模型 文本 地表特征 图像
2
一种颈部淋巴结肿瘤转移路径多模态智能识别系统
智能识别系统 模组 多模态 语义特征 肿瘤
3
房源验真方法、设备、介质及程序产品
房源验真方法 音频 识别策略 语音 存储装置
4
具有自清洗功能的分体式加热棒无线控制方法
无线控制方法 模拟退火算法 加热棒 能耗 皮尔逊相关系数
5
一种离线知识库构建及搜索方法
知识库构建方法 离线 搜索方法 数据 深度学习模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号