一种模型内存占用优化方法、设备、介质、产品及系统

AITNT
正文
推荐专利
一种模型内存占用优化方法、设备、介质、产品及系统
申请号:CN202410874870
申请日期:2024-07-02
公开号:CN118409873B
公开日期:2024-08-30
类型:发明专利
摘要
本申请公开了计算机技术领域内的一种模型内存占用优化方法、设备、介质、产品及系统。本申请针对特定推理请求预测其推理结果的内存占用范围,约束了推理结果的内存占用量,且该过程综合考虑了预训练模型所在的目标异构算力设备的当前内存剩余空间,由此结合设备的实际内存使用情况进行内存优化设计,不仅能够节约异构算力的内存,避免算力闲置与资源浪费,还能实现用户无感知,为提升推理请求处理效率和并发数提供了可能。
技术关键词
内存占用优化方法 预训练模型 异构 算力系统 字符 策略 设备运行信息 控制设备 非易失性存储介质 内存占用量 存储计算机程序 计算机程序产品 客户端 处理器 列表 参数 电子设备 指令
系统为您推荐了相关专利信息
1
一种说话人提取方法及系统
语音识别模型 融合特征 音频 递归神经网络 语音编码器
2
合同审查处理方法及电子设备
实体 策略 索引 机器可读指令 逻辑
3
一种异常交易检测方法、装置、设备、介质及产品
交易检测方法 客户端 翻译模型 业务系统 参数
4
医疗器械数字化供应链AI智能数据分析的方法和装置
模板 文本 语音播报功能 生成提示词 大语言模型
5
一种中文古籍图像的数字化方法
数字化方法 文本识别模型 文本检测模型 文本行 特征金字塔网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号