摘要
本发明提供一种训练人工智能模型的运算装置与方法,该装置包含储存装置及处理器。该储存装置储存程序码,其中该程序码包含该人工智能模型,以及该人工智能模型包含物体检测器、多层感知器及交互行为解码器。该处理器用以载入并执行该程序码,其中该人工智能模型会执行以下训练操作:在第一阶段,先对该物体检测器进行训练;以及在第二阶段,利用该第一阶段所获得的参数来初始化该物体检测器的一部分,并对该人工智能模型进行训练,其中该人工智能模型的训练包含利用预训练模型进行知识蒸馏训练,以将该预训练模型的知识迁移至该多层感知器的输出。本发明能够提升人工智能模型的泛化性。
技术关键词
物体检测器
训练人工智能模型
多层感知器
运算装置
预训练模型
检测解码器
文本编码器
储存装置
转换器
蒸馏
程序
图像
处理器
参数
系统为您推荐了相关专利信息
漏洞挖掘平台
强化学习算法
预训练模型
漏洞知识库
对抗性
负荷特征
电力负荷预测方法
电力负荷预测模型
预测电力负荷
电力系统
微视频流行度预测
融合多模态特征
模块
文本
注意力
轨迹补全方法
轨迹预测模型
编码特征
车辆
历史轨迹数据