一种AI大模型的优化方法、系统、终端设备及存储介质

正文

推荐专利

申请号：CN202411487044

申请日期：2024-10-24

公开号：CN119005363B

公开日期：2025-02-07

类型：发明专利

摘要

本发明公开了一种AI大模型的优化方法、系统、终端设备及存储介质，所述方法通过资源预测模型对各子模型实时负载数据进行预测，预测未来一段时间内各子模型的资源需求，进而确定资源分配策略，并通过行为预测模型对实时用户行为数据进行预测，生成子模型请求预测结果，通过缓存一致性协议和缓存策略对子模型请求预测结果确定预加载策略，最后利用资源分配策略动态且合理地调整资源分配，减少计算资源的损耗，并利用预加载策略将AI大模型的各子模型进行预加载，减少模型加载时间，实现提高AI大模型中各子模型的响应速度和吞吐量，解决了目前很多子模型因响应速度慢和吞吐率低导致用户的使用体验较差的问题。

技术关键词

缓存一致性协议资源分配策略负载特征数据预测模型训练缓存策略状态更新缓存淘汰策略模型超参数序列模型训练模块数据采集模块终端设备训练集注意力指标

系统为您推荐了相关专利信息

船舶远程驾驶光场感知的边缘服务模型优化方法及系统

模型优化方法卸载策略时延深度强化学习视点渲染

一种任务执行时长预测模型训练方法、装置及电子设备

神经网络模型预测模型训练方法网格样本数据获取模块

一种考虑扩散式数据增强的风电功率可信预测方法

风电功率预测模型历史气象数据多层感知机风电功率预测技术预测误差

一种平衡车控制方法及系统

平衡车控制方法 PID控制参数性能预测模型预测模型训练 PID控制器

一种随机工况电池组的故障识别方法及装置

电池单体电池状态参数车辆状态参数故障识别方法电池组荷电状态

一种AI大模型的优化方法、系统、终端设备及存储介质

站点导航

APP 下载