基于两阶段解耦方式的语音大模型模态对齐方法及装置

AITNT
正文
推荐专利
基于两阶段解耦方式的语音大模型模态对齐方法及装置
申请号:CN202510185747
申请日期:2025-02-20
公开号:CN119670718B
公开日期:2025-06-10
类型:发明专利
摘要
本发明提供一种基于两阶段解耦方式的语音大模型模态对齐方法及装置,涉及自然语言处理技术领域。该方法包括:获取预训练的语音数据集以及预训练的任务指令文本;构建初始的语音大模型,根据预训练的语音数据集以及预训练的任务指令文本,采用两阶段解耦方式处对初始的语音大模型进行预训练,获得预训练好的语音大模型;采用LoRA微调技术对预训练好的语音大模型进行指令微调,获得训练好的语音大模型;将待处理的语音数据和语音数据对应的指令,输入训练好的语音大模型中进行处理,输出与语音数据对应的指令需求相匹配的文本。采用本发明可解决在特征解耦导致信息损失的问题,采用本发明可提高语音大模型对任务分析的性能。
技术关键词
语音特征 大语言模型 文本 微调技术 两阶段 对齐模块 计算机可读取存储介质 数据 对齐方法 语音编码器 音频编码器 训练集 计算机可读指令 对齐设备 序列 语义 对齐装置
系统为您推荐了相关专利信息
1
基于事件模式的文本数据反向生成方法和装置
文本 大语言模型 预训练语言模型 数据 时序
2
基于GNF3Linear映射函数微调的图像分类方法及系统
图像分类方法 图像分类模型 非暂态计算机可读存储介质 内存 图像分类系统
3
一种基于大语言模型的全过程项目管理的系统及方法
大语言模型 项目全生命周期 一体化模块 风险 估计概率密度函数
4
一种基于大语言模型的作战文书生成方法及系统
文书生成方法 大语言模型 场景 模板 验证规则
5
大气污染过程分析方法、电子设备及存储介质
分析方法 三元组 实体 大语言模型 图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号