摘要
本发明提供一种基于两阶段解耦方式的语音大模型模态对齐方法及装置,涉及自然语言处理技术领域。该方法包括:获取预训练的语音数据集以及预训练的任务指令文本;构建初始的语音大模型,根据预训练的语音数据集以及预训练的任务指令文本,采用两阶段解耦方式处对初始的语音大模型进行预训练,获得预训练好的语音大模型;采用LoRA微调技术对预训练好的语音大模型进行指令微调,获得训练好的语音大模型;将待处理的语音数据和语音数据对应的指令,输入训练好的语音大模型中进行处理,输出与语音数据对应的指令需求相匹配的文本。采用本发明可解决在特征解耦导致信息损失的问题,采用本发明可提高语音大模型对任务分析的性能。
技术关键词
语音特征
大语言模型
文本
微调技术
两阶段
对齐模块
计算机可读取存储介质
数据
对齐方法
语音编码器
音频编码器
训练集
计算机可读指令
对齐设备
序列
语义
对齐装置
系统为您推荐了相关专利信息
图像分类方法
图像分类模型
非暂态计算机可读存储介质
内存
图像分类系统
大语言模型
项目全生命周期
一体化模块
风险
估计概率密度函数