摘要
本发明提供了一种基于音素间隔序列的生成音频鉴别与生成区域定位方法,可以应用于人工智能技术领域。该方法包括:对生成音频鉴别请求中待鉴别音频信号的音素进行标记,得到被标记音素;根据被标记音素的连续出现频率,构建待鉴别音频信号的初始音素间隔序列;基于生成音频鉴别请求中携带的生成音频鉴别方式,对初始音素间隔序列进行处理,得到目标音素间隔序列;将目标音素间隔序列输入到生成音频鉴别模型中,通过对提取到的多尺度动力学特征进行分析,输出待鉴别音频信号的真伪鉴别结果。该方法可以适用于生成音频的真假二值鉴别,得到生成音频的整体真伪结果,也适用于区域伪造检测和定位,得到属于真实音频以及属于生成音频的区域定位结果。
技术关键词
音频
多尺度特征提取
序列
样本
区域定位方法
子模块
本子
信号
标记
区域定位装置
标签
输入模块
矩阵
误差
参数
人工智能技术
频率
关系
系统为您推荐了相关专利信息
大语言模型
命名实体识别技术
构建查询语句
主题
交叉注意力机制
滑坡易发性评价方法
深度学习模型
数据
样本
联邦学习模型
序列
扑克
计算机可执行指令
子模块
可读存储介质
预报方法
长短期记忆网络
数值预报产品
时间段
数据
图像去雾方法
样本采集器
编码器
训练器
多尺度特征