一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质

正文

推荐专利

申请号：CN202510108344

申请日期：2025-01-23

公开号：CN119943033B

公开日期：2025-10-14

类型：发明专利

摘要

本发明涉及一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质，属于语音识别领域。本发明包括步骤：获取多任务语音识别相关的数据集；多任务语音识别相关的数据集预处理；利用音调扰动和说话人扰动的语音数据进行训练预训练语言模型，并通过微调预训练语言模型最后两层实现对语音表征的优化；提取扰动语音的表征后，通过Sinkhorn‑Knopp算法对表征矩阵进行归一化；通过设计对比损失函数，优化表征的语义一致性并提升预训练语言模型对内容的聚合能力。本发明通过利用自监督微调预训练模型，有效的解决了语音内容表征和说话人表征解耦问题，提升了模型在内容相关的识别任务上的性能。

技术关键词

预训练语言模型学习方法多任务算法自动语音识别说话人识别矩阵电子设备可读存储介质预训练模型学习系统数据音频特征处理器语音特征语义代表

系统为您推荐了相关专利信息

一种基于非参数化网络的少样本3D场景分割方法

场景分割方法原型样本多尺度特征融合局部感受野

一种高增益热电磁透波结构优化设计方法

透波结构优化设计方法雷达天线结构服役工况电磁

一种具身智能多模态巡查感知方法、系统、设备及存储介质

巡检装置多模态信息多模态数据融合 SLAM算法红外热成像仪

基于多参数在线检测的盾构渣土重金属污染智能分选系统及其方法

盾构渣土智能分选系统多参数在线检测模块智能密度计

一种数字孪生驱动的车联算力网络中任务年龄感知的按需调度优化方法

调度优化模型年龄数字孪生驱动调度优化算法任务调度

一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质

站点导航

APP 下载