一种面向边缘计算的轻量化大模型智能客服部署方法

AITNT
正文
推荐专利
一种面向边缘计算的轻量化大模型智能客服部署方法
申请号:CN202510876642
申请日期:2025-06-27
公开号:CN120386534A
公开日期:2025-07-29
类型:发明专利
摘要
本发明公开了一种面向边缘计算的轻量化大模型智能客服部署方法,涉及人工智能与边缘计算技术领域。该方法包括:获取预训练的大语言模型,基于彩票假说进行剪枝,得到赢家票子网络;将其稀疏结构重映射为V:N:M结构化稀疏格式,并与权重及掩码共同加载至片上存储器;在变换器层插入侧枝出口并进行token剪枝;监控困惑度与置信度,高负载时动态恢复不超过5%的被剪枝权重;对低置信度或敏感token,上传其8位量化隐藏态至云端大模型进行协同推理,结果与本地推理输出合并。本发明降低了边缘设备推理延迟与通信开销,提高了智能客服系统在低算力环境下的响应效率和部署经济性。
技术关键词
令牌 存储器保护单元 静态随机存取存储器 变换器 大语言模型 云端 智能客服系统 序列 键值 边缘计算技术 索引 分布式训练 注意力 标志位 彩票 权重数 人机接口 网络
系统为您推荐了相关专利信息
1
一种钓鱼邮件身份溯源方法、电子设备及存储介质
钓鱼邮件 溯源方法 诱饵 身份 木马
2
一种电动修井机电控系统
修井机电控系统 数据采集模块 多模态数据融合 分析模块 图像捕捉
3
一种情绪分析方法和装置、电子设备及存储介质
情绪分析方法 实体 曲线 客户 极值
4
一种信息采集方法及相关装置
信息采集方法 大语言模型 文本 生成提示词 对话系统
5
一种人脸图像识别方法、装置、电子设备和存储介质
识别人脸图像 生成人脸特征 令牌 人脸图像识别方法 生成人脸图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号