一种高质量语音数据库的生成方法及系统

AITNT
正文
推荐专利
一种高质量语音数据库的生成方法及系统
申请号:CN202510177336
申请日期:2025-02-18
公开号:CN120299445A
公开日期:2025-07-11
类型:发明专利
摘要
本发明提供在一种高质量语音数据库的生成方法及系统,方法包括:收集设定数量的种子声音数据;利用种子声音数据生成目标文本数据,准备需要合成的文本;采用基于AI大模型的声音克隆技术,利用深度学习算法和大量的数据训练,实现对特定说话人声音的高精度模仿和复刻,生成语音数据;对生成的语音数据进行音频数据质量验证,去除不合格的语音数据,保障语音数据库的质量,得到高质量的语音数据库。本发明大幅度减少了语音数据采集的成本,能够快速生成大量高质量的语音数据,显著缩短了语音数据库的制作周期,提高了语音数据采集的效率;提高了生成的语音数据与对应的文本一致性,保证了语音数据的准确性和自然性,提升了语音数据库的整体质量。
技术关键词
声音克隆技术 文本 生成方法 语音识别系统 音频 种子 深度学习算法 生成系统 生成语音 语音特征 编辑 数据收集单元 计算机设备 端点 人类 大语言模型 处理器 模块
系统为您推荐了相关专利信息
1
网络割接工单的生成方法、装置、计算机设备和存储介质
关键字 大语言模型 文本 模版 字段
2
一种自动驾驶地图不确定性量化方法、装置、设备及介质
不确定性量化方法 车辆轨迹数据 多视角 不确定性参数 轨迹预测模型
3
面向跨模态分子检索的课程学习框架、产品、介质和设备
跨模态 样本 文本编码器 分子 框架
4
动态密钥生成方法、升级包加密方法、软件升级方法
动态密钥生成方法 身份验证信息 软件升级方法 软件升级系统 接收方
5
一种高精度存储音频数据的音质提升方法及固态硬盘
数字播放系统 音质提升方法 时钟 高精度恒温晶振 高低频噪声
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号