摘要
本申请涉及网络架构搜索技术领域,尤其涉及基于思维链推理的图神经网络设计方法、系统以及装置。其中,方法包括:基于大语言模型对网络设计请求进行意图识别,输出宏观框架;根据宏观框架定义每一个网络层级的微观搜索空间配置和超参数搜索空间配置;通过思维链规划函数根据微观搜索空间配置和超参数搜索空间配置分别构建微观结构思维链和超参数思维链;通过思维链推理函数确定最优微观结构组合和最优超参数组合,最终得到最优图神经网络。本申请通过思维链将原本单步的推理过程转换为一系列可解释性的中间推理步骤,避免模型的黑盒问题;同时,引导预训练的大语言模型进行图神经网络设计,能够避免现有搜索框架因反馈优化导致的算力消耗。
技术关键词
神经网络设计方法
搜索空间配置
超参数
构建微观结构
大语言模型
层级
融合策略
意图识别
节点
网络架构
多路径
规划
生成结构
搜索技术
框架
设计系统
定义
决策
系统为您推荐了相关专利信息
图像增强模型
图像增强方法
拉丁超立方采样
模块
皮肤变黑
虚拟设备
服务器
化操作系统
网络连接方法
大语言模型
多模态
情感识别模型
超参数
互动方法
训练深度学习模型