摘要
本发明公开了一种基于多模态数据的新生儿眼底图像分类方法及成像方法,包括获取现有的新生儿眼底图像数据并处理构建训练数据集;选取若干新生儿眼底图像进行文本标注;离线状态下提取文本特征并提取对应的图像特征;基于预训练的图像编码器和文本编码器进行文本特征生成器的训练;构建包括了图像预测模块、伪文本预测模块和融合模块的新生儿眼底图像分类初始模型并训练得到训练后的新生儿眼底图像分类模型;采用新生儿眼底图像分类模型进行实际的新生儿眼底图像的分类。本发明不仅能够实现基于多模态数据的新生儿眼底图像分类,而且可靠性更高,精确性更好。
技术关键词
眼底图像分类方法
图像编码器
多模态
图像分类模型
信息熵
文本编码器
注意力机制
线性
成像方法
模块
密集特征
数据
令牌
全局平均池化
离线
训练集
系统为您推荐了相关专利信息
多模态
建筑物
数字高程模型数据
信息提取方法
数字表面模型
分类识别模型
网络
多模态特征
数据
计算机程序产品
人工智能识别
大数据
多模态数据采集
时钟同步模块
混合学习模型