多模态模型训练方法、装置、电子设备、存储介质及计算机程序产品

AITNT
正文
推荐专利
多模态模型训练方法、装置、电子设备、存储介质及计算机程序产品
申请号:CN202510866307
申请日期:2025-06-25
公开号:CN120910553A
公开日期:2025-11-07
类型:发明专利
摘要
本申请公开了一种多模态模型训练方法、装置、电子设备、存储介质及计算机程序产品,其中,方法包括:将第一语言的文本数据输入第一编码器,输出第一编码;第一编码器表征教师模型的文本编码器;将一种或多种第二语言的文本数据输入第二编码器,输出一个或多个第二编码;第二编码器表征学生模型的文本编码器,学生模型用于处理一种或多种第二语言的多模态数据;将图文数据中的图像输入第三编码器,输出第三编码,并将图像输入第四编码器,输出第四编码;第三编码器表征教师模型的图像编码器;第四编码器表征学生模型的图像编码器;基于第一编码与一个或多个第二编码,训练第二编码器,以及基于第三编码和第四编码,训练第四编码器。
技术关键词
文本编码器 图像编码器 学生 模型训练方法 计算机程序产品 教师 数据 矩阵 多模态 处理单元 模型训练装置 电子设备 处理器 图文 参数 蒸馏
系统为您推荐了相关专利信息
1
多通道射频收发器采样误差的校准方法及装置
多通道射频收发器 增益误差 偏置误差 校准方法 采样系统
2
一种基于强化深度学习的电化学储能热滥用预警方法
电化学储能设备 时序 温度预测模型 预警方法 数据
3
用于向非对比计算机断层扫描成像数据提供自动分段的系统及其方法
人工智能模型 可执行程序代码 计算机断层扫描 成像 数据接口
4
用于测试大语言模型的方法、装置及计算机设备、存储介质、程序产品
大语言模型 服务端 超参数 链路 界面
5
文案生成方法以及多模态信息生成方法
文案生成方法 多模态信息 大语言模型 样本 计算机可执行指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号