摘要
本发明公开了一种基于离群类抑制的领域对抗部分域适应知识迁移方法及系统,涉及人工智能与机器人技术领域。构建知识迁移框架,包括领域判别器和分类器;从源域和目标域的数据中提取特征;将提取的特征通过领域判别器对抗对齐,利用分类器的离群类抑制功能抑制源域中离群类样本的传播;接收观察输入后,基于动作映射层之前的特征输出计算源域和目标域的公共特征,作为智能体策略的共性知识;根据公共特征和目标智能体的观察输出计算迁移损失,用于更新目标智能体的策略网络。旨在解决移动多智能体相同域任务场景下,因任务目标点变化导致原有策略适应性差的问题,通过领域对抗对齐与离群类抑制双重机制提升知识迁移效率与准确性。
技术关键词
知识迁移方法
样本
分类器
特征提取器
网络
标签
权重策略
迁移系统
特征提取模块
机器人技术
框架
超参数
机制
数据
核心
场景
系统为您推荐了相关专利信息
皮蛋
机器学习模型
品质检测装置
品质检测方法
传送组件
车载CAN总线
入侵检测方法
样本
密度
车载网络安全技术
智能康复训练
多模态信息融合
肌电特征
姿态特征
动态时间规整算法