摘要
本发明适用于人工智能领域,提供了一种基于人工智能的语音处理方法和装置。在本实施例中,获取到目标用户的原始语音数据后,先根据切割参数对其进行切割处理,去除该原始语音数据中的静音数据;再根据降噪需求确定降噪模型对该切割后的语音数据进行降噪;然后根据降噪后的数据确定语音克隆模型的参数,以便该语音克隆模型对该目标用户进行语音克隆。最后将故事文本输入自然语言处理模型,获得语义理解结果后,通过语音克隆模型克隆出该故事文本对应的目标语音。本申请不但可以在语音处理中高效精准地去除静音片段和复杂噪音,还能将文本信息克隆成目标用户的语音,从而可以逼真、自然的实现家长故事语音的合成,满足孩子对亲子语音内容的需求。
技术关键词
降噪模型
降噪需求
语音特征
说话人识别技术
数据
模型库
参数
令牌
音频
机器学习算法
降噪单元
自然语言
关键字
切割单元
编码技术
格式化
语义
文本
信号处理
系统为您推荐了相关专利信息
碳酸盐油藏
混合粒子群算法
拉丁超立方采样
精度
数值
图片识别方法
汽车配件
全局特征提取
ResNet网络
图像哈希算法
软核处理器
物理存储单元
集成系统
智能连接器
控制接口
动态评估方法
混合交通流
交通车辆
指标
监测设备
驾驶员腿部
后台服务器
控制系统
车辆状态数据
图像处理器