摘要
本发明涉及语音检测技术领域,并提供了基于TinyML的端侧深度合成语音检测方法,包括如下步骤:S100、接收原始音频信号,通过汉明窗进行分帧处理,帧长为20ms,帧移为10ms;S200、提取复合声学特征集,包括:传统声学特征,深度伪造敏感特征,S300、通过动态特征选择模块,根据设备实时电池电量P和CPU负载率L激活或禁用特征分量,S400、将筛选后的特征输入轻量化对抗训练模型,输出深度合成语音概率值;S500、采用置信度驱动的分级决策机制。首次在端侧实现资源自适应、多模态协同、持续进化的深度合成语音检测框架,攻克了资源受限场景下检测精度与能效的平衡难题,为移动支付、隐私通话等场景提供毫秒级主动防御能力。
技术关键词
语音检测方法
动态特征选择
声学特征
禁用特征
语音检测技术
差分隐私技术
拉普拉斯噪声
卷积模块
质心偏移量
多模态协同
激活设备
协处理器
机制
频段
模型更新
隔离电路
决策
音频
动态更新
系统为您推荐了相关专利信息
呼吸机管路
动态稳定系统
波动特征
效能数据
特征量化参数
动态特征选择
样本类别标签
矩阵
检测模型训练
坐标
特征选择方法
激光雷达
区域生长算法
像素
图像分割
远程医疗辅助系统
患者
机器学习分类器
服务端
医患匹配