基于多模态特征融合与动态权重优化的大模型分布式推理加速方法

AITNT
正文
推荐专利
基于多模态特征融合与动态权重优化的大模型分布式推理加速方法
申请号:CN202510958489
申请日期:2025-07-11
公开号:CN120560855A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及大模型技术领域,更具体地,涉及一种基于多模态特征融合与动态权重优化的大模型分布式推理加速方法,所述方法包括以下步骤:S1:通过内嵌在负载均衡器中的推理上下文分析模块进行实时语义解析得到语义特征;S2:根据语义特征来计算缓存适配度;S3:查询全局缓存目录服务获取匹配节点列表,结合缓存适配情况、节点负载情况以及网络质量的各项参数,运用多融合决策算法来做出决策;S4:根据决策在负载均衡层部署全局缓存目录服务,在各计算节点维护本地缓存池并实时同步缓存元数据至全局缓存目录服务中。本发明解决了在采用常规负载均衡策略进行多节点部署时,容易造成计算资源的浪费、增加系统整体能耗、降低请求处理速度等问题。
技术关键词
动态权重优化 多模态特征融合 语义特征 决策算法 条目 分布式事务日志 负载均衡器 目录 保障数据一致性 节点 主题 新鲜度 负载均衡策略 心跳协议 分析模块 因子 校验机制 融合策略
系统为您推荐了相关专利信息
1
结直肠癌分类网络的训练方法、装置、设备及介质
特征提取模块 核心 生物标志物 样本 分类网络
2
基于多模态数据汇聚乡村社会化服务平台
数据汇聚方法 多模态 构建知识图谱 交叉注意力机制 异构
3
基于多模态和AI的文本用户情感分析方法及系统
情感类别 多模态特征融合 情感分类器 节点 情感分析方法
4
基于模型应用场景的模型构建方法和装置
序列 模型构建方法 生成场景 机器学习模型 意图识别模型
5
一种数字孪生模型数据的高效互操作方法和系统
数字孪生模型 语义特征提取 设计测试用例 数据互操作 数据格式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号