基于GPT的渐进迁移训练解码方法

AITNT
正文
推荐专利
基于GPT的渐进迁移训练解码方法
申请号:CN202411912148
申请日期:2024-12-24
公开号:CN119918616A
公开日期:2025-05-02
类型:发明专利
摘要
本发明公开了一种基于GPT的渐进迁移训练解码方法,属于视觉神经解码领域。本发明基于被试观看大量视觉感知图像时记录下的功能磁共振信号数据构建了基于GPT的类别和文本解码模型,其包括:图像编码器,用于将采用预训练模型提取的图像特征向量嵌入到隐特征空间:文本编码器,将包含任务信息的Prompt和位置编码嵌入到隐特征空间;视觉信息编码器,使用GRU将大脑视觉区域体素信号映射到隐特征空间;全脑信息编码器,根据大脑视觉区域体素信号作为上下文,指导大脑其他区域的体素信号的选取,并将全局信息映射到隐特征空间;语言生成器,融合以上所有的隐特征并选取概率最高的Token以进行对应内容的文本生成。本发明提高了解码准确率,增强了模型的泛化能力。
技术关键词
信息编码器 图像特征向量 视觉 功能磁共振信号 图像编码器 解码模型 文本编码器 矩阵 序列 融合器 词嵌入向量 解码方法 线性插值法 图像特征提取模型 解码器 阶段 多头注意力机制 预训练模型
系统为您推荐了相关专利信息
1
一种基于跨模态提示学习与视觉引导的印刷电路板缺陷检测方法及系统
视觉特征 样本 跨模态 特征提取模块 三元组
2
一种基于多模态语义生成与图文融合的长尾图像识别方法
图像识别方法 多模态 图文 双分支网络 风格
3
一种基于Al的视频内容分析方法及系统
视频内容分析方法 半监督学习方法 视频流 元素 动态优先级调度算法
4
基于迭代强化学习的VLA模型优化方法、装置、设备及介质
模型优化方法 解码器 轨迹 机器人 图像特征向量
5
一种片区改造方法、装置、计算机设备及存储介质
全景视频 场景 眼动数据 改造方法 注视点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号