面向混合语音的歌曲高光自动提取方法

AITNT
正文
推荐专利
面向混合语音的歌曲高光自动提取方法
申请号:CN202510821980
申请日期:2025-06-19
公开号:CN120730090A
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开了一种面向混合语音的歌曲高光自动提取方法,包括:S10,对原始音视频文件进行解析,提取混合音频轨并转换为标准音频格式,作为后续处理的统一输入源;S20,对混合音频进行歌曲检测;S30,获取交替分布的歌唱与非歌唱片段序列;S40,基于非歌唱片段的时长阈值进行初步歌曲窗口划分;S50,对每个初步划分的歌曲窗口,进一步细分判断是否包含多首歌;S60,在每首划定歌曲内筛选一个高光候选片段;S70,在每个高光候选片段中,采用滑动窗口方式划分多个子片段,利用拟合人类主观偏好的高光评分模型对各子片段进行打分,选取得分最高者作为最终高光;S80,对所有高光片段进行去重处理;S90,将最终高光片段从原始音频中裁剪并导出为标准音频格式。
技术关键词
二分类模型 语音 音频 滑动窗口 标签 人声 段落结构 序列 音视频 分类阈值 背景噪声 样本 超参数 采样率 训练集 策略 人类 依序 批量 机制
系统为您推荐了相关专利信息
1
一种基于振动声学方法的焊接结构件监测方法及系统
焊接结构件 超声波传播速度 焊接工艺参数 声学方法 相控阵探头
2
一种语音合成方法及装置
对象 注意力模型 样本 数值 语音特征分解
3
基于多模态感知的车辆紧急事件智能响应方法
压力传感单元 智能响应方法 关节点 检测异常事件 多模态传感器系统
4
一种可变密码的无线通信方法
可变密码 无线通信方法 无线通信系统 动态密码 密钥
5
基于RFID标签的数据处理容错方法、装置、设备及介质
应用软件系统 校验数据序列 容错方法 RFID标签数据 循环冗余校验算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号