摘要
本发明涉及人工智能技术领域,公开了一种模型训练方法、装置、设备及介质,包括:基于多个第一图像数据和多个第二图像数据,生成多组第一正负样本对,且基于多个第一图像数据和多个第一文本数据,生成多组第二正负样本对;基于多组第一正样本对和多组第一负样本对,对第一图像编码器进行训练,得到第二图像编码器;基于多组第二正样本对和多组第二负样本对,对第二图像编码器和第一大语言模型进行训练,得到第三图像编码器和第二大语言模型;基于多组第二正样本对、多组第二负样本对、第三图像编码器和第三大语言模型,对第二大语言模型进行训练,得到演讲稿生成模型。使得最终生成的演讲稿生成模型可以将幻灯片的格式统一以图片形式进行理解。
技术关键词
图像编码器
大语言模型
样本
数据
模型训练方法
图像块
文本
矩阵
图像编辑器
模型训练装置
可读存储介质
人工智能技术
尺寸
处理器
注意力
模块
标签
计算机设备
参数
系统为您推荐了相关专利信息
大语言模型
控制模型训练方法
控制交通信号灯
交通控制方法
文本
PWM占空比
自动补偿方法
LCD背光亮度
自动补偿系统
调节背光亮度
工程勘察数据
边坡模型
动态分析方法
措施
分析模块