模型训练方法和装置、数据处理方法和设备

AITNT
正文
推荐专利
模型训练方法和装置、数据处理方法和设备
申请号:CN202411388340
申请日期:2024-09-30
公开号:CN119337956A
公开日期:2025-01-21
类型:发明专利
摘要
本公开涉及一种模型训练方法和装置、数据处理方法和设备。该模型训练方法包括:对网络模型的多层第一编码器模块进行词元剪枝,其中,所述词元为输入序列中的词元,所述词元为根据输入的文本数据或图像数据确定的;根据词元剪枝数据调整第一编码器模块的层数和第二编码器模块的层数;对网络模型的多层第二编码器模块进行模块剪枝。本公开低层编码器模块和高层编码器模块采用不同剪枝粒度来进行剪枝,提高了剪枝效果。
技术关键词
编码器模块 模型训练方法 自然语言 模型训练装置 数据处理方法 网络 序列 文本 训练样本数据 编码器结构 数据处理设备 可读存储介质 计算机程序产品 图像 处理器 指令 矩阵
系统为您推荐了相关专利信息
1
一种基于大数据的电子信息技术的数据处理方法
数据巡检 电子信息技术 序列 数据处理方法 频率
2
一种待识别药品名称的识别方法、装置及存储介质
图谱 识别方法 元素 算法 自然语言
3
铁路信号系统中数据处理方法和装置
分组密码算法 加密数据 铁路信号系统 加密算法 差值算法
4
基于大模型的汽车说明书解析、语音播报及指令控制方法
指令控制方法 自然语言 车机 表格 文本
5
一种考虑多维影响因素的沥青路面养护数据处理方法及系统
沥青路面养护 数据处理方法 神经网络模型 损耗 周期
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号