一种基于人工智能的语音处理方法和装置

AITNT
正文
推荐专利
一种基于人工智能的语音处理方法和装置
申请号:CN202510701108
申请日期:2025-05-28
公开号:CN120412613A
公开日期:2025-08-01
类型:发明专利
摘要
本发明适用于人工智能领域,提供了一种基于人工智能的语音处理方法和装置。在本实施例中,获取到目标用户的原始语音数据后,先根据切割参数对其进行切割处理,去除该原始语音数据中的静音数据;再根据降噪需求确定降噪模型对该切割后的语音数据进行降噪;然后根据降噪后的数据确定语音克隆模型的参数,以便该语音克隆模型对该目标用户进行语音克隆。最后将故事文本输入自然语言处理模型,获得语义理解结果后,通过语音克隆模型克隆出该故事文本对应的目标语音。本申请不但可以在语音处理中高效精准地去除静音片段和复杂噪音,还能将文本信息克隆成目标用户的语音,从而可以逼真、自然的实现家长故事语音的合成,满足孩子对亲子语音内容的需求。
技术关键词
降噪模型 降噪需求 语音特征 说话人识别技术 数据 模型库 参数 令牌 音频 机器学习算法 降噪单元 自然语言 关键字 切割单元 编码技术 格式化 语义 文本 信号处理
系统为您推荐了相关专利信息
1
多源多精度数据融合的岩性油藏变可信度代理优化方法
碳酸盐油藏 混合粒子群算法 拉丁超立方采样 精度 数值
2
一种汽车配件图片识别方法、装置以及设备
图片识别方法 汽车配件 全局特征提取 ResNet网络 图像哈希算法
3
一种基于FPGA的PCIe根复合体集成系统
软核处理器 物理存储单元 集成系统 智能连接器 控制接口
4
一种高速施工区混合交通韧性动态评估方法、系统
动态评估方法 混合交通流 交通车辆 指标 监测设备
5
一种驾驶行为和习惯的智能检测和控制系统
驾驶员腿部 后台服务器 控制系统 车辆状态数据 图像处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号