摘要
本发明涉及计算机视觉与认知神经科学领域,特别是涉及一种自然图像的人脑认知文本描述生成方法及系统,本发明通过预先构建将fMRI信号与经CLIP针对各种复杂场景获取的图像特征向量和文本特征向量形成映射的fMRI‑Image映射模型,并将获取到的人脑基于刺激图像产生的fMRI信号,并对获取到的fMRI信号进行预处理,以得到处理后的fMRI信号,将预处理后的fMRI信号输入到构建fMRI‑Image映射模型中,以得到图像特征向量和文本特征向量,将fMRI‑Image映射模型输出的图像特征向量和文本特征向量输入到预训练的语言映射模型,以生成图像文本描述,从而能够从复杂的自然场景中提取视觉语义特征,有助于准确生成对自然图像的文本描述。
技术关键词
文本特征向量
图像特征向量
文本生成模型
人脑
生成方法
网络
样本
预训练模型
认知神经科学
图像匹配
可读存储介质
信号获取模块
定义
参数
图像获取模块
信号处理模块
自然场景
系统为您推荐了相关专利信息
文本识别方法
文本识别模型
文本生成模型
图像拼接
样本
储能电站
规模
历史负荷数据
调峰需求
时间选择器
航线生成方法
卡尔曼滤波器
深度强化学习
控制船舶
船舶自动化控制