一种基于多元信息感知的大规模模型预训练方法

AITNT
正文
推荐专利
一种基于多元信息感知的大规模模型预训练方法
申请号:CN202411620281
申请日期:2024-11-14
公开号:CN119129691B
公开日期:2025-03-21
类型:发明专利
摘要
本发明提供一种基于多元信息感知的大规模模型预训练方法,将采集到的图像、文本、音频数据输入预训练数据库,将预训练数据库中小批量标注形成识别数据库,利用预训练数据库中的数据对识别模型进行无监督模式预训练,预训练分别从三个感知态展开,将预训练模型得到的参数作为识别模型的初始化参数,基于识别数据库进行模型的监督学习训练,得到最终的智能识别模型。本发明以无监督学习为基石,依托大规模模型预训练的强大能力,分别利用判别式模型和生成式模型进行大规模模型预训练,实现了对海量无标注数据的有效利用;支持广泛的多模态数据的输入,采用互信息最大化‑对比损失作为核心优化目标,使模型能够流畅的处理多模态数据间复杂关系。
技术关键词
预训练方法 文本 编码结构 解码结构 音频 图像块 词语 原始图像内容 模型预训练 采集医学图像数据 语法结构 无监督 标注工具 分块 样本 相差显微镜
系统为您推荐了相关专利信息
1
基于多模态信号的OSA患者分类方法、设备和介质
分类方法 多模态 分类子模型 静态特征 信号
2
一种面向医疗机构的大语言模型训练方法、系统、终端及介质
语言模型训练方法 面向医疗机构 患者医疗数据 样本 大语言模型
3
基于多模态大模型的文案编辑方法、装置和存储介质
编辑方法 关键词 数据处理模块 多模态 主题
4
基于图像识别的电子对抗侦察干扰训练评估方法
训练评估方法 图像识别模型 电子对抗设备 信号 操作界面
5
基于语义理解的社交媒体情感分析系统及方法
社交媒体平台 情感分析模型 情感分析系统 文本 情感特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号