用于多语言任务的模型预训练方法和装置

正文

推荐专利

用于多语言任务的模型预训练方法和装置

申请号：CN202411831139

申请日期：2024-12-12

公开号：CN119293514B

公开日期：2025-08-01

类型：发明专利

摘要

本申请提供了用于多语言任务的模型预训练方法和装置，涉及人工智能技术领域，方法包括：获取多模态训练数据集，训练数据集包括具有多语言内容的多个样本文本数据和多个样本图文对数据，涵盖通用领域和预设业务领域；基于多个样本图文对数据，对初始模型进行视觉特征和文本特征对齐的对比学习训练，在训练过程中冻结解码模块的模型参数并调整视觉编码器和投影模块的模型参数，至满足第一结束条件；基于多个样本图文对数据和多个样本文本数据，对满足第一结束条件的初始模型进行内容理解的约束训练，在训练过程中调整视觉编码器、投影模块和解码模块的模型参数，至满足第二结束条件得到目标模型；本申请能够显著提升模型在特定领域的信息提取能力。

技术关键词

图文样本视觉特征文本特征提取模块投影模块图像融合特征解码模块预训练方法数据多语言分词网络大语言模型路由器元素注意力机制多尺度滑动窗口

系统为您推荐了相关专利信息

场景物体的处理方法、装置、设备及存储介质

场景物体视觉问答模型语句标签

电力领域热点话题发现方法、装置、介质和设备

标签文本大语言模型指令热点话题发现方法种子

代码开发同步方法、装置、设备及存储介质

脚本计算机执行指令生成自然语言同步方法框架

基于机器学习的守时系统故障检测方法、系统、设备及存储介质

系统故障检测方法守时系统矩阵数据前馈神经网络

一种多模态智能问答方法、系统及装置

多模态路径探索方法智能问答方法答案实体

用于多语言任务的模型预训练方法和装置

站点导航

APP 下载