一种基于DeepSeekR1大模型的轻量化优化方法

AITNT
正文
推荐专利
一种基于DeepSeekR1大模型的轻量化优化方法
申请号:CN202511117627
申请日期:2025-08-11
公开号:CN120911617A
公开日期:2025-11-07
类型:发明专利
摘要
一种基于DeepSeekR1大模型的轻量化优化方法,其特征是将词元向量维度设定为最多1024个维度,只保留核心语义;设置局部选窗窗口,每个词元仅聚焦关注相邻最多256个词元;按领域分组固化专家路由;限定专家能力,只保留普适性即高频存在的知识方案;根据高频关联词直接生成完整意义的短语,仅验证核心术语不被颠覆即可即句意完全相反,仅保留普适方案。能够有效降低大模型运转时的算力需求,内部数据交换时的带宽需求小,功耗、发热小,能耗设备成本低,利于本地部署,通过牺牲30%的深度泛化能力,如政策分析、工业减排,换取速度提升和能效优化,让减碳建议从"专家报告"变为"随身指南"。
技术关键词
核心 网络模块 术语 阶段 语义 文本 关键词 单路 答案 能效 档位 报告 功耗 分层 能耗 编码 工业 模式 参数
系统为您推荐了相关专利信息
1
基于深度学习的多模态设计作品智能分类与检索系统
检索系统 系统运维监控 智能推荐系统 紫外光谱成像技术 级联分类器
2
一种多级滤波放大抑制器
噪声系数 低噪声放大器 信号采集模块 多路接收通道 多通道
3
一种基于感知增强门控网络的小麦染病麦穗分割方法
分割方法 特征提取单元 输出特征 图像 网络
4
一种双重隔离型闭环控制电路
闭环控制电路 隔离驱动电路 隔离采集模块 电阻 滤波电感
5
面向复杂开放场景的三维语义分割方法
三维语义分割方法 点云特征提取 三维特征提取 场景 图像语义分割模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号