基于在线结构剪枝的文本推理方法以及相关设备

AITNT
正文
推荐专利
基于在线结构剪枝的文本推理方法以及相关设备
申请号:CN202510180806
申请日期:2025-02-19
公开号:CN119647605B
公开日期:2025-06-03
类型:发明专利
摘要
本申请提供了一种基于在线结构剪枝的文本推理方法以及相关设备,方法包括:在接收到文本推理任务时,获取未进行剪枝的文本推理模型,以及获取文本推理模型中多个解码层基于目标结构化剪枝算法进行剪枝时生成的掩模信息和算法参数信息;针对文本推理模型中的每个解码层,分别根据对应的掩模信息对解码层进行权重掩模处理,以及根据对应的算法参数信息对解码层进行输出补偿处理,得到目标剪枝模型;通过目标剪枝模型执行文本推理任务,得到文本推理结果,其中,本申请可以在推理时基于掩模信息和算法参数信息在线生成结构化剪枝的目标剪枝模型,无需保存结构化剪枝后的模型,能够有效降低文本推理方法的存储开销。
技术关键词
文本推理方法 多层感知机 剪枝模型 掩模 解码 算法 模块 矩阵 在线 计算机可执行指令 注意力参数 补偿值 推理装置 可读存储介质 处理器 元素 电子设备 程序
系统为您推荐了相关专利信息
1
用于自动编码器的帧间译码变换
视频编码器 译码 机器学习模型 视频解码器 图像编码
2
一种基于自适应噪声模板的循环平稳干扰信号去噪方法
噪声模板 脑机接口信号 去噪方法 时延 滑动窗口
3
基于特征增强与语言感知属性引导的视觉定位方法
视觉定位方法 语义特征 模态特征 对象 跨模态
4
基于混合注意力机制的腹部CT图像分割方法
腹部CT图像 注意力机制 分割方法 编码器 图像全局信息
5
一种光场图像的压缩方法
微透镜 图像 矩形 视频编码算法 边缘检测算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号