摘要
本发明公开一种通用的图像分类神经网络架构自动搜索方法及系统,属于神经网络架构搜索领域;方法包括:S1随机生成N个卷积神经网络架构,并使用评估器对每个架构进行训练,获得性能数据;对架构进行离散化表示,并与其对应的性能数据放入在架构池中;S2使用架构池中的离散架构训练编码器和解码器;S3将编码器输出的离散架构的连续表示及其图像分类性能数据存入数据集D中,并使用数据集D训练预测器;S4从数据集D中选取性能最好的K个架构,通过梯度上升的方式优化选取的架构,并用评估器训练评估得到性能数据;将新架构及其性能数据添加到架构池P中;S5重复S2‑S4,直到完成L次迭代,最终输出架构池P中性能最好的架构。
技术关键词
图像分类神经网络
自动搜索方法
编码器
解码器
前馈神经网络
数据
分类准确率
交叉注意力机制
神经网络架构搜索
序列
索引
通信接口
计算机存储介质
搜索系统
计算机程序产品
处理器
模块