面向多场景合并数据集的数据感知混合专家模型训练方法

AITNT
正文
推荐专利
面向多场景合并数据集的数据感知混合专家模型训练方法
申请号:CN202411917072
申请日期:2024-12-24
公开号:CN119740622A
公开日期:2025-04-01
类型:发明专利
摘要
本发明公开了面向多场景合并数据集的数据感知混合专家模型训练方法,涉及人工智能技术领域,包括如下步骤:收集多场景的数据并预处理,构建多场景合并数据集;步构建混合模型:所述混合模型采用基于transformer端到端的DINO结构,将DINO结构的解码器中的FFN层替换为MOE层,所述MOE层包括多个独立设置的专家网络,每个专家网络是一个独立的神经网络,用于处理指定数据集的特征;构建专家网络的前景目标损失函数;设置路由机制,用于将每个场景数据集的token路由到对应的专家网络;将多场景合并数据集输入到混合模型中,以对每个专家网络进行训练;该模型训练方法,提升混合模型在多场景数据集下的检测精度。
技术关键词
模型训练方法 面向多场景 数据 计算机可读储存介质 分类程序 累积分布函数 机制 网络分配 人工智能技术 解码器 处理器 图像 计算机设备 索引 存储器 标签 样本
系统为您推荐了相关专利信息
1
一种微电网的自适应负荷管理与优化控制方法
超级电容器 优化控制方法 系统运行状态 平抑微网功率波动 储能单元
2
样品的基于模型的声光深度计量
光束 脉冲泵 电路系统 信号 图案化晶片
3
一种跨时钟多模块集成的FPGA实时信号处理结构及方法
实时信号处理 多模块 时钟 集成模块 输出模块
4
对话辅助方法、设备、存储介质及计算机程序产品
实时语音 大语言模型 定义标签 情感识别模型 多任务
5
驿站快递件揽收方法、装置、设备及存储介质
快递件 驿站 订单 分类规则 列表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号