大模型资源分配方法、装置、设备和介质

AITNT
正文
推荐专利
大模型资源分配方法、装置、设备和介质
申请号:CN202411096211
申请日期:2024-08-09
公开号:CN119094472A
公开日期:2024-12-06
类型:发明专利
摘要
本公开提供了一种大模型资源分配方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及大模型资源分配等技术领域,能够用于生成式搜索、文档智能编辑、智能助手、虚拟助手、智能电商等应用场景。该方法包括:经由流量网关对目标业务的大模型资源请求接口进行代理;获取目标业务的第一资源量和第二资源量,第一资源量表征目标业务所申请的资源量需求,第二资源量指示目标业务的历史资源量使用情况;基于目标业务的第一资源量和第二资源量,计算目标业务的第三资源量,第三资源量表征为目标业务额外预留的资源量;以及至少基于目标业务的第二资源量和第三资源量,利用流量网关为目标业务分配大模型资源。
技术关键词
业务分配 资源分配方法 网关 资源分配装置 人工智能技术 计算机程序产品 电子设备 处理器通信 指令 可读存储介质 接口 存储器 电商 编辑 场景
系统为您推荐了相关专利信息
1
一种机车大数据底座架构及其工作方法
机车 数据存储策略 联机事务处理技术 底座 大数据分析服务
2
健康科普资料生成方法和装置、电子设备及存储介质
主题 文本段落 资料 生成方法 风格
3
一种基于大语言模型的能源决策生成方法及系统
能源 大语言模型 决策生成方法 强化学习算法 数据
4
基于边缘计算的多模型服务智能调度优化方法及系统
调度优化方法 多模型 策略 密钥 冲突检测机制
5
基于用户意图的零代码端到端人工智能模型开发系统
人工智能模型 工作流 智能系统开发 生成API接口 可视化界面
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号