一种基于持续学习和迁移学习的预训练多模态语言推理模型的模态扩展方法

正文

推荐专利

申请号：CN202410941985

申请日期：2024-07-15

公开号：CN118469025B

公开日期：2024-09-10

类型：发明专利

摘要

本发明提供一种基于持续学习和迁移学习的预训练多模态语言推理模型的模态扩展方法，属于多模态理解与语言交互技术领域。本发明主要利用构建的多模态语言推理模型进行语言推理，此后，在多模态语言推理模型的模态扩展过程中，借助可灵活扩展的多模态适配器组合模块解决模态扩展中的数据依赖问题，并引入迁移学习中的适配器微调和持续学习中的冻结‑激活策略解决计算负担和知识遗忘问题，最终解决了预训练多模态语言推理模型的模态扩展难题。

技术关键词

适配器组合模块多模态注意力音频跨模态视频对齐模块矩阵参数线性图像交互技术编码器令牌策略级联基础点云

一种基于持续学习和迁移学习的预训练多模态语言推理模型的模态扩展方法

站点导航

APP 下载