摘要
本发明公开了一种面向混合语音的歌曲高光自动提取方法,包括:S10,对原始音视频文件进行解析,提取混合音频轨并转换为标准音频格式,作为后续处理的统一输入源;S20,对混合音频进行歌曲检测;S30,获取交替分布的歌唱与非歌唱片段序列;S40,基于非歌唱片段的时长阈值进行初步歌曲窗口划分;S50,对每个初步划分的歌曲窗口,进一步细分判断是否包含多首歌;S60,在每首划定歌曲内筛选一个高光候选片段;S70,在每个高光候选片段中,采用滑动窗口方式划分多个子片段,利用拟合人类主观偏好的高光评分模型对各子片段进行打分,选取得分最高者作为最终高光;S80,对所有高光片段进行去重处理;S90,将最终高光片段从原始音频中裁剪并导出为标准音频格式。
技术关键词
二分类模型
语音
音频
滑动窗口
标签
人声
段落结构
序列
音视频
分类阈值
背景噪声
样本
超参数
采样率
训练集
策略
人类
依序
批量
机制
系统为您推荐了相关专利信息
焊接结构件
超声波传播速度
焊接工艺参数
声学方法
相控阵探头
压力传感单元
智能响应方法
关节点
检测异常事件
多模态传感器系统
可变密码
无线通信方法
无线通信系统
动态密码
密钥
应用软件系统
校验数据序列
容错方法
RFID标签数据
循环冗余校验算法