用于多语言任务的模型预训练方法和装置

AITNT
正文
推荐专利
用于多语言任务的模型预训练方法和装置
申请号:CN202411831139
申请日期:2024-12-12
公开号:CN119293514B
公开日期:2025-08-01
类型:发明专利
摘要
本申请提供了用于多语言任务的模型预训练方法和装置,涉及人工智能技术领域,方法包括:获取多模态训练数据集,训练数据集包括具有多语言内容的多个样本文本数据和多个样本图文对数据,涵盖通用领域和预设业务领域;基于多个样本图文对数据,对初始模型进行视觉特征和文本特征对齐的对比学习训练,在训练过程中冻结解码模块的模型参数并调整视觉编码器和投影模块的模型参数,至满足第一结束条件;基于多个样本图文对数据和多个样本文本数据,对满足第一结束条件的初始模型进行内容理解的约束训练,在训练过程中调整视觉编码器、投影模块和解码模块的模型参数,至满足第二结束条件得到目标模型;本申请能够显著提升模型在特定领域的信息提取能力。
技术关键词
图文 样本 视觉特征 文本 特征提取模块 投影模块 图像 融合特征 解码模块 预训练方法 数据 多语言 分词 网络 大语言模型 路由器 元素 注意力机制 多尺度 滑动窗口
系统为您推荐了相关专利信息
1
场景物体的处理方法、装置、设备及存储介质
场景 物体 视觉问答模型 语句 标签
2
电力领域热点话题发现方法、装置、介质和设备
标签文本 大语言模型 指令 热点话题发现方法 种子
3
代码开发同步方法、装置、设备及存储介质
脚本 计算机执行指令 生成自然语言 同步方法 框架
4
基于机器学习的守时系统故障检测方法、系统、设备及存储介质
系统故障检测方法 守时系统 矩阵 数据 前馈神经网络
5
一种多模态智能问答方法、系统及装置
多模态 路径探索方法 智能问答方法 答案 实体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号