一种基于多尺度蒸馏的轻量化说话人识别方法

正文

推荐专利

申请号：CN202510375690

申请日期：2025-03-27

公开号：CN120431937A

公开日期：2025-08-05

类型：发明专利

摘要

本发明公开了一种基于多尺度蒸馏的轻量化说话人识别方法，利用自监督预训练的教师模型提取高质量说话人嵌入，通过预测增强机制和多尺度对齐策略，将知识迁移至轻量级学生模型。预测增强机制通过基础温度池和非对称温度缩放生成多样化的软标签，提升学生模型的学习能力；多尺度对齐策略从单样本、批量样本和类别三个层面优化知识传递，确保学生模型全面学习教师模型的表示能力；联合优化结合分类损失和对齐损失，进一步提升模型性能。本发明显著降低模型参数量和计算复杂度，适用于移动终端和嵌入式系统等场景，同时保持在复杂语音环境下的鲁棒性和泛化能力，具有广泛的实际应用价值。

技术关键词

说话人识别方法教师学生多尺度轻量化神经网络样本策略蒸馏批量模型压缩嵌入式系统语音特征参数矩阵复杂度跨设备数据机制移动终端

系统为您推荐了相关专利信息

基于混合视觉Mamba网络的遥感图像变化检测方法

差分解码器混合模块混合编码器融合特征子模块

一种基于参数轻量级动态聚合策略的小目标检测方法

训练集上采样多尺度网络参数

一种重尾噪声下鲁棒概率假设密度SLAM方法

SLAM方法机器人位姿粒子密度策略更新

基于小波包阙值与VMD的泄漏声波降噪方法及系统

鲸鱼算法信噪比筛选降噪方法重构包络

融合物联网与云计算的智能配电综合监控系统

配电综合监控系统融合物联网时间序列模型设备运行参数智能控制模块

一种基于多尺度蒸馏的轻量化说话人识别方法

站点导航

APP 下载