摘要
本发明提供了一种篡改音频的定位方法及装置,可以应用于计算机技术和音频信号处理技术领域。该篡改音频的定位方法包括:对待检测音频进行特征提取处理,得到第一特征和第二特征,其中,第一特征表征了待检测音频的语音特征,第二特征表征了待检测音频的时序自一致性特征;根据第一特征和第二特征,确定融合特征,其中,融合特征的维度与待检测音频的帧数相同;以及,将融合特征输入至经训练的强化学习网络,得到定位结果,其中,定位结果表征了待检测音频中篡改音频的位置。
技术关键词
强化学习网络
融合特征
语音特征
训练样本集
策略
标签
定位方法
特征提取网络
音频信号处理技术
训练语音模型
经验小波变换
序列
时序
分支
决策
定位模块
定义