摘要
本发明涉及一种基于歌声合成大模型生成儿歌的方法,包括以下步骤:收集数据,系统性整理和高质量筛选各类适用于儿童的儿歌资源,得到人声音轨与背景音乐音轨,实现文本与音频对齐;训练儿歌风格模型,用于后续批量打标;将人声音轨、背景音乐音轨、音频对齐的文本数据和批量打标的数据输入预训练的大模型进行训练,得到生成儿歌的大模型,以生成儿歌。本发明可以生成与已有歌曲相仿的儿歌,还可以创作出具有生成人独有音色的歌曲。
技术关键词
风格
音频
文本
自动语音识别
TTS技术
批量
标签体系
数据
模式
儿童
传统型
资源
样本
音效
成人
游戏
阶段
运动
系统为您推荐了相关专利信息
地理实体
命名识别方法
门控循环单元
前馈神经网络
序列
曲面零部件
打磨控制方法
打磨工具
状态控制模块
打磨控制系统