一种语音大模型的自适应层次表征对齐训练方法及装置

正文

推荐专利

申请号：CN202510206425

申请日期：2025-02-25

公开号：CN119721258B

公开日期：2025-06-10

类型：发明专利

摘要

本发明提供一种语音大模型的自适应层次表征对齐训练方法及装置，涉及自然语言处理技术领域；该方法包括：基于内部语音适应器，根据候选语音大模型，使用源语音以及文本提示词进行模型训练，获得第一语音大模型；基于跨模态语义检索任务，根据源语音以及源语音转录文本，对第一语音大模型的进行语义检索能力筛选，获得最优神经网络层级；基于最优神经网络层级，根据源语音、文本提示词和源语音转录文本，通过第一语音大模型进行预测，并计算模型预测损失；根据模型预测损失，对第一语音大模型进行参数优化，获得第二语音大模型；本发明是一种充分利用源语音和转录文本的映射关系的高效且准确的自适应层次表征对齐训练方法。

技术关键词

注意力层级语义矩阵计算机可读取存储介质跨模态文本生成模型计算机可读指令训练设备训练装置语音编码器模型训练模块数据获取模块自然语言处理器度量

一种语音大模型的自适应层次表征对齐训练方法及装置

站点导航

APP 下载