基于GPT的渐进迁移训练解码方法

正文

推荐专利

基于GPT的渐进迁移训练解码方法

申请号：CN202411912148

申请日期：2024-12-24

公开号：CN119918616A

公开日期：2025-05-02

类型：发明专利

摘要

本发明公开了一种基于GPT的渐进迁移训练解码方法，属于视觉神经解码领域。本发明基于被试观看大量视觉感知图像时记录下的功能磁共振信号数据构建了基于GPT的类别和文本解码模型，其包括：图像编码器，用于将采用预训练模型提取的图像特征向量嵌入到隐特征空间：文本编码器，将包含任务信息的Prompt和位置编码嵌入到隐特征空间；视觉信息编码器，使用GRU将大脑视觉区域体素信号映射到隐特征空间；全脑信息编码器，根据大脑视觉区域体素信号作为上下文，指导大脑其他区域的体素信号的选取，并将全局信息映射到隐特征空间；语言生成器，融合以上所有的隐特征并选取概率最高的Token以进行对应内容的文本生成。本发明提高了解码准确率，增强了模型的泛化能力。

技术关键词

信息编码器图像特征向量视觉功能磁共振信号图像编码器解码模型文本编码器矩阵序列融合器词嵌入向量解码方法线性插值法图像特征提取模型解码器阶段多头注意力机制预训练模型

系统为您推荐了相关专利信息

一种基于跨模态提示学习与视觉引导的印刷电路板缺陷检测方法及系统

视觉特征样本跨模态特征提取模块三元组

一种基于多模态语义生成与图文融合的长尾图像识别方法

图像识别方法多模态图文双分支网络风格

一种基于Al的视频内容分析方法及系统

视频内容分析方法半监督学习方法视频流元素动态优先级调度算法

基于迭代强化学习的VLA模型优化方法、装置、设备及介质

模型优化方法解码器轨迹机器人图像特征向量

一种片区改造方法、装置、计算机设备及存储介质

全景视频场景眼动数据改造方法注视点

基于GPT的渐进迁移训练解码方法

站点导航

APP 下载