一种模型训练方法、装置、介质和程序产品

正文

推荐专利

一种模型训练方法、装置、介质和程序产品

申请号：CN202411537508

申请日期：2024-10-30

公开号：CN119418320B

公开日期：2025-09-30

类型：发明专利

摘要

本申请提供了一种模型训练方法、装置、电子设备、计算机可读介质和计算机程序产品。本申请的方法包括：完成对目标模型的预训练后，通过冻结目标模型中目标参数之外的参数，来针对目标参数相应的部分进行训练；获取待执行的检测任务对应的目标训练图像集；将已冻结的参数进行解冻处理后，基于目标训练图像集对目标模型进行微调。本申请通过在模型训练阶段冻结相关参数，从而仅训练词表映射层和待执行的场景文本任务相关的参数，并在微调阶段解冻所有可学习的参数来基于场景文本任务对应的数据集对模型进行微调，该训练方式减少了在目标数据集上训练微调的成本。

技术关键词

模型训练方法参数图像全局特征提取局部特征提取解码器计算机程序指令控制点计算机程序产品编码器曲线模型训练装置处理器滑动方法文本电子设备生成噪声场景

系统为您推荐了相关专利信息

一种基于深度强化学习的数据库索引优化方法和系统

索引优化方法子模块深度强化学习模式深度Q网络

一种林区占地分析方法及其系统

林区三维模型三维重建算法数据采集设备森林结构

基于弱相关知识蒸馏的无参考图像质量评价方法及系统

多尺度语义特征协方差矩阵掩码矩阵评价方法评价图像

针对肺结节CT扫描的双分支网络3D图像分割方法

边界特征 CT扫描解码器图像分割方法双分支网络

基于离群值分离激活值混合量化的神经网络优化方法

神经网络优化方法神经网络优化系统通道因子量化误差

一种模型训练方法、装置、介质和程序产品

站点导航

APP 下载