多模态模型的训练方法、文本生成方法及装置

AITNT
正文
推荐专利
多模态模型的训练方法、文本生成方法及装置
申请号:CN202510706389
申请日期:2025-05-28
公开号:CN120807672A
公开日期:2025-10-17
类型:发明专利
摘要
本申请公开了多模态模型的训练方法、文本生成方法及装置,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。具体实现方案为:对第一多模态模型中的第一视觉编码器进行训练,得到经训练的第一视觉编码器;其中,第一多模态模型中的第一大语言模型的模型参数数量小于预设阈值;对第二大语言模型和经训练的第一视觉编码器进行训练,得到目标多模态模型;其中,第二大语言模型包括在第二多模态模型中。
技术关键词
大语言模型 图像特征向量 多模态 样本 文本生成方法 图文 文本生成装置 注意力 序列 参数 人工智能技术 计算机程序产品 计算机视觉 训练装置 处理器通信 分块
系统为您推荐了相关专利信息
1
标准体系模型的构建系统
构建系统 目录 分析单元 节点 采集单元
2
空地自适应融合感知方法
栅格地图 行人检测 视觉 数据采集装置 多层级特征
3
图像生成方法以及训练图像生成模型的方法
图像生成模型 语义 样本 特征提取模型 图像生成方法
4
基于深度强化学习的财务机器人发票识别与匹配方法
发票 字段 深度强化学习 高维特征向量 图像特征向量
5
一种电动滚筒控制方法及控制系统
作业行程 滑动时间窗口 决策 参数 时间段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号