基于两阶段解耦方式的语音大模型模态对齐方法及装置

正文

推荐专利

申请号：CN202510185747

申请日期：2025-02-20

公开号：CN119670718B

公开日期：2025-06-10

类型：发明专利

摘要

本发明提供一种基于两阶段解耦方式的语音大模型模态对齐方法及装置，涉及自然语言处理技术领域。该方法包括：获取预训练的语音数据集以及预训练的任务指令文本；构建初始的语音大模型，根据预训练的语音数据集以及预训练的任务指令文本，采用两阶段解耦方式处对初始的语音大模型进行预训练，获得预训练好的语音大模型；采用LoRA微调技术对预训练好的语音大模型进行指令微调，获得训练好的语音大模型；将待处理的语音数据和语音数据对应的指令，输入训练好的语音大模型中进行处理，输出与语音数据对应的指令需求相匹配的文本。采用本发明可解决在特征解耦导致信息损失的问题，采用本发明可提高语音大模型对任务分析的性能。

技术关键词

语音特征大语言模型文本微调技术两阶段对齐模块计算机可读取存储介质数据对齐方法语音编码器音频编码器训练集计算机可读指令对齐设备序列语义对齐装置

系统为您推荐了相关专利信息

基于事件模式的文本数据反向生成方法和装置

文本大语言模型预训练语言模型数据时序

基于GNF3Linear映射函数微调的图像分类方法及系统

图像分类方法图像分类模型非暂态计算机可读存储介质内存图像分类系统

一种基于大语言模型的全过程项目管理的系统及方法

大语言模型项目全生命周期一体化模块风险估计概率密度函数

一种基于大语言模型的作战文书生成方法及系统

文书生成方法大语言模型场景模板验证规则

大气污染过程分析方法、电子设备及存储介质

分析方法三元组实体大语言模型图谱

基于两阶段解耦方式的语音大模型模态对齐方法及装置

站点导航

APP 下载