面向混合语音的歌曲高光自动提取方法

正文

推荐专利

面向混合语音的歌曲高光自动提取方法

申请号：CN202510821980

申请日期：2025-06-19

公开号：CN120730090A

公开日期：2025-09-30

类型：发明专利

摘要

本发明公开了一种面向混合语音的歌曲高光自动提取方法，包括：S10，对原始音视频文件进行解析，提取混合音频轨并转换为标准音频格式，作为后续处理的统一输入源；S20，对混合音频进行歌曲检测；S30，获取交替分布的歌唱与非歌唱片段序列；S40，基于非歌唱片段的时长阈值进行初步歌曲窗口划分；S50，对每个初步划分的歌曲窗口，进一步细分判断是否包含多首歌；S60，在每首划定歌曲内筛选一个高光候选片段；S70，在每个高光候选片段中，采用滑动窗口方式划分多个子片段，利用拟合人类主观偏好的高光评分模型对各子片段进行打分，选取得分最高者作为最终高光；S80，对所有高光片段进行去重处理；S90，将最终高光片段从原始音频中裁剪并导出为标准音频格式。

技术关键词

二分类模型语音音频滑动窗口标签人声段落结构序列音视频分类阈值背景噪声样本超参数采样率训练集策略人类依序批量机制

系统为您推荐了相关专利信息

一种基于振动声学方法的焊接结构件监测方法及系统

焊接结构件超声波传播速度焊接工艺参数声学方法相控阵探头

一种语音合成方法及装置

对象注意力模型样本数值语音特征分解

基于多模态感知的车辆紧急事件智能响应方法

压力传感单元智能响应方法关节点检测异常事件多模态传感器系统

一种可变密码的无线通信方法

可变密码无线通信方法无线通信系统动态密码密钥

基于RFID标签的数据处理容错方法、装置、设备及介质

应用软件系统校验数据序列容错方法 RFID标签数据循环冗余校验算法

面向混合语音的歌曲高光自动提取方法

站点导航

APP 下载