一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质

AITNT
正文
推荐专利
一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质
申请号:CN202510108344
申请日期:2025-01-23
公开号:CN119943033B
公开日期:2025-10-14
类型:发明专利
摘要
本发明涉及一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质,属于语音识别领域。本发明包括步骤:获取多任务语音识别相关的数据集;多任务语音识别相关的数据集预处理;利用音调扰动和说话人扰动的语音数据进行训练预训练语言模型,并通过微调预训练语言模型最后两层实现对语音表征的优化;提取扰动语音的表征后,通过Sinkhorn‑Knopp算法对表征矩阵进行归一化;通过设计对比损失函数,优化表征的语义一致性并提升预训练语言模型对内容的聚合能力。本发明通过利用自监督微调预训练模型,有效的解决了语音内容表征和说话人表征解耦问题,提升了模型在内容相关的识别任务上的性能。
技术关键词
预训练语言模型 学习方法 多任务 算法 自动语音识别 说话人识别 矩阵 电子设备 可读存储介质 预训练模型 学习系统 数据 音频特征 处理器 语音特征 语义 代表
系统为您推荐了相关专利信息
1
一种基于非参数化网络的少样本3D场景分割方法
场景分割方法 原型 样本 多尺度特征融合 局部感受野
2
一种高增益热电磁透波结构优化设计方法
透波结构 优化设计方法 雷达天线结构 服役工况 电磁
3
一种具身智能多模态巡查感知方法、系统、设备及存储介质
巡检装置 多模态信息 多模态数据融合 SLAM算法 红外热成像仪
4
基于多参数在线检测的盾构渣土重金属污染智能分选系统及其方法
盾构渣土 智能分选系统 多参数 在线检测模块 智能密度计
5
一种数字孪生驱动的车联算力网络中任务年龄感知的按需调度优化方法
调度优化模型 年龄 数字孪生驱动 调度优化算法 任务调度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号