一种模型训练方法、装置、介质和程序产品

AITNT
正文
推荐专利
一种模型训练方法、装置、介质和程序产品
申请号:CN202411537508
申请日期:2024-10-30
公开号:CN119418320B
公开日期:2025-09-30
类型:发明专利
摘要
本申请提供了一种模型训练方法、装置、电子设备、计算机可读介质和计算机程序产品。本申请的方法包括:完成对目标模型的预训练后,通过冻结目标模型中目标参数之外的参数,来针对目标参数相应的部分进行训练;获取待执行的检测任务对应的目标训练图像集;将已冻结的参数进行解冻处理后,基于目标训练图像集对目标模型进行微调。本申请通过在模型训练阶段冻结相关参数,从而仅训练词表映射层和待执行的场景文本任务相关的参数,并在微调阶段解冻所有可学习的参数来基于场景文本任务对应的数据集对模型进行微调,该训练方式减少了在目标数据集上训练微调的成本。
技术关键词
模型训练方法 参数 图像 全局特征提取 局部特征提取 解码器 计算机程序指令 控制点 计算机程序产品 编码器 曲线 模型训练装置 处理器 滑动方法 文本 电子设备 生成噪声 场景
系统为您推荐了相关专利信息
1
一种基于深度强化学习的数据库索引优化方法和系统
索引优化方法 子模块 深度强化学习 模式 深度Q网络
2
一种林区占地分析方法及其系统
林区 三维模型 三维重建算法 数据采集设备 森林结构
3
基于弱相关知识蒸馏的无参考图像质量评价方法及系统
多尺度语义特征 协方差矩阵 掩码矩阵 评价方法 评价图像
4
针对肺结节CT扫描的双分支网络3D图像分割方法
边界特征 CT扫描 解码器 图像分割方法 双分支网络
5
基于离群值分离激活值混合量化的神经网络优化方法
神经网络优化方法 神经网络优化系统 通道 因子 量化误差
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号