一种基于多元信息感知的大规模模型预训练方法

正文

推荐专利

申请号：CN202411620281

申请日期：2024-11-14

公开号：CN119129691B

公开日期：2025-03-21

类型：发明专利

摘要

本发明提供一种基于多元信息感知的大规模模型预训练方法，将采集到的图像、文本、音频数据输入预训练数据库，将预训练数据库中小批量标注形成识别数据库，利用预训练数据库中的数据对识别模型进行无监督模式预训练，预训练分别从三个感知态展开，将预训练模型得到的参数作为识别模型的初始化参数，基于识别数据库进行模型的监督学习训练，得到最终的智能识别模型。本发明以无监督学习为基石，依托大规模模型预训练的强大能力，分别利用判别式模型和生成式模型进行大规模模型预训练，实现了对海量无标注数据的有效利用；支持广泛的多模态数据的输入，采用互信息最大化‑对比损失作为核心优化目标，使模型能够流畅的处理多模态数据间复杂关系。

技术关键词

预训练方法文本编码结构解码结构音频图像块词语原始图像内容模型预训练采集医学图像数据语法结构无监督标注工具分块样本相差显微镜

系统为您推荐了相关专利信息

基于多模态信号的OSA患者分类方法、设备和介质

分类方法多模态分类子模型静态特征信号

一种面向医疗机构的大语言模型训练方法、系统、终端及介质

语言模型训练方法面向医疗机构患者医疗数据样本大语言模型

基于多模态大模型的文案编辑方法、装置和存储介质

编辑方法关键词数据处理模块多模态主题

基于图像识别的电子对抗侦察干扰训练评估方法

训练评估方法图像识别模型电子对抗设备信号操作界面

基于语义理解的社交媒体情感分析系统及方法

社交媒体平台情感分析模型情感分析系统文本情感特征

一种基于多元信息感知的大规模模型预训练方法

站点导航

APP 下载