摘要
本发明提供在一种高质量语音数据库的生成方法及系统,方法包括:收集设定数量的种子声音数据;利用种子声音数据生成目标文本数据,准备需要合成的文本;采用基于AI大模型的声音克隆技术,利用深度学习算法和大量的数据训练,实现对特定说话人声音的高精度模仿和复刻,生成语音数据;对生成的语音数据进行音频数据质量验证,去除不合格的语音数据,保障语音数据库的质量,得到高质量的语音数据库。本发明大幅度减少了语音数据采集的成本,能够快速生成大量高质量的语音数据,显著缩短了语音数据库的制作周期,提高了语音数据采集的效率;提高了生成的语音数据与对应的文本一致性,保证了语音数据的准确性和自然性,提升了语音数据库的整体质量。
技术关键词
声音克隆技术
文本
生成方法
语音识别系统
音频
种子
深度学习算法
生成系统
生成语音
语音特征
编辑
数据收集单元
计算机设备
端点
人类
大语言模型
处理器
模块
系统为您推荐了相关专利信息
不确定性量化方法
车辆轨迹数据
多视角
不确定性参数
轨迹预测模型
动态密钥生成方法
身份验证信息
软件升级方法
软件升级系统
接收方
数字播放系统
音质提升方法
时钟
高精度恒温晶振
高低频噪声