一种基于量化感知微调的大模型推理方法、装置及介质

AITNT
正文
推荐专利
一种基于量化感知微调的大模型推理方法、装置及介质
申请号:CN202411830901
申请日期:2024-12-12
公开号:CN119962665A
公开日期:2025-05-09
类型:发明专利
摘要
本发明公开了一种基于量化感知微调的大模型推理方法、装置及介质。其中,方法包括:将大模型的原始参数矩阵进行结构改造,确定各通道原始参数矩阵对应的横向向量化向量、纵向向量化向量以及低比特固定矩阵;基于横向向量化向量、纵向向量化向量以及低比特固定矩阵对大模型进行逐层进行参数量化微调预训练,获取大模型各通道的横向向量化向量值和纵向向量化向量值;根据大模型各通道的横向向量化向量值、纵向向量化向量值以及低比特固定矩阵,确定大模型部署推理的部署参数矩阵;采用部署有部署参数矩阵的大模型对输入数据进行推理分析获取输入数据的推理结果。
技术关键词
矩阵 通道 参数 推理方法 推理装置 表达式 电子设备 数据 处理器 可读存储介质 指令 存储器 子模块 计算机
系统为您推荐了相关专利信息
1
一种基于技术需求的技术人才检索和匹配方法
关键词 年龄 技术专业 报告 企业
2
动画生成方法、装置、计算机设备和计算机可读存储介质
虚拟对象 顶点 动画生成方法 运动 数据
3
一种信号PIN的成型工艺
电镀 在线检测模块 反馈控制器 药水 生成工艺
4
基于自注意力机制的改进CNN进行虚假新闻检测的方法
注意力机制 字符 多尺度卷积核 矩阵 文本
5
一种基于多模态表征的物品推荐方法、装置、设备及介质
样本 物品推荐方法 文本编码器 图像编码器 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号