摘要
本发明涉及一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质,属于语音识别领域。本发明包括步骤:获取多任务语音识别相关的数据集;多任务语音识别相关的数据集预处理;利用音调扰动和说话人扰动的语音数据进行训练预训练语言模型,并通过微调预训练语言模型最后两层实现对语音表征的优化;提取扰动语音的表征后,通过Sinkhorn‑Knopp算法对表征矩阵进行归一化;通过设计对比损失函数,优化表征的语义一致性并提升预训练语言模型对内容的聚合能力。本发明通过利用自监督微调预训练模型,有效的解决了语音内容表征和说话人表征解耦问题,提升了模型在内容相关的识别任务上的性能。
技术关键词
预训练语言模型
学习方法
多任务
算法
自动语音识别
说话人识别
矩阵
电子设备
可读存储介质
预训练模型
学习系统
数据
音频特征
处理器
语音特征
语义
代表
系统为您推荐了相关专利信息
场景分割方法
原型
样本
多尺度特征融合
局部感受野
透波结构
优化设计方法
雷达天线结构
服役工况
电磁
巡检装置
多模态信息
多模态数据融合
SLAM算法
红外热成像仪
盾构渣土
智能分选系统
多参数
在线检测模块
智能密度计
调度优化模型
年龄
数字孪生驱动
调度优化算法
任务调度