一种基于多分片的录音合成方法及系统

正文

推荐专利

一种基于多分片的录音合成方法及系统

申请号：CN202411099419

申请日期：2024-08-12

公开号：CN118968963A

公开日期：2024-11-15

类型：发明专利

摘要

本发明公开了一种基于多分片的录音合成方法及系统；本发明涉及语音合成技术领域；步骤S1，音频可视化：将多分片音频的多个录音片段的总的音频信号转换为音频图像AI，例如声谱图或梅尔频率倒谱系数图，并将音频图像AI作为YOLOv3算法的输入。步骤S2，特征提取：使用YOLOv3算法对转换后的音频图像AI进行特征提取；提取的特征包括与音频波形w和节奏模式r；本发明通过使用Darknet‑53深度卷积神经网络对音频特征进行非线性变换和卷积操作，该方案能够提取更高层次的音频特征，从而更准确地判断音频片段的同步状态。在合成多分片音频时，各个片段在时间和节奏上的同步更加精确，减少了不同步带来的音质问题。

技术关键词

YOLOv3算法深度卷积神经网络分片时间偏移量音频特征参数图像高层次全局平均池化矩阵声谱处理器非线性波形动态地模式存储器元素

系统为您推荐了相关专利信息

一种情感交流模式的识别设备及识别方法

特征提取单元识别方法模式识别识别设备情绪识别模型

一种用于信息娱乐系统的流程管理方法及管理平台

文件断点续传标志位信息娱乐系统分片文件夹

处理方法及电子设备

相位检测自动对焦音频特征连续自动对焦策略图像处理

一种图片分类方法、装置、介质及设备

深度卷积神经网络生成图像识别模型图片分类方法评估算法训练集

一种基于分布式多探头的井下岩壁断裂定位系统及方法

多探头线缆收纳装置定位方法传送机构采集电路

一种基于多分片的录音合成方法及系统

站点导航

APP 下载