摘要
本发明涉及大模型技术领域,更具体地,涉及一种基于多模态特征融合与动态权重优化的大模型分布式推理加速方法,所述方法包括以下步骤:S1:通过内嵌在负载均衡器中的推理上下文分析模块进行实时语义解析得到语义特征;S2:根据语义特征来计算缓存适配度;S3:查询全局缓存目录服务获取匹配节点列表,结合缓存适配情况、节点负载情况以及网络质量的各项参数,运用多融合决策算法来做出决策;S4:根据决策在负载均衡层部署全局缓存目录服务,在各计算节点维护本地缓存池并实时同步缓存元数据至全局缓存目录服务中。本发明解决了在采用常规负载均衡策略进行多节点部署时,容易造成计算资源的浪费、增加系统整体能耗、降低请求处理速度等问题。
技术关键词
动态权重优化
多模态特征融合
语义特征
决策算法
条目
分布式事务日志
负载均衡器
目录
保障数据一致性
节点
主题
新鲜度
负载均衡策略
心跳协议
分析模块
因子
校验机制
融合策略
系统为您推荐了相关专利信息
数据汇聚方法
多模态
构建知识图谱
交叉注意力机制
异构
情感类别
多模态特征融合
情感分类器
节点
情感分析方法
序列
模型构建方法
生成场景
机器学习模型
意图识别模型
数字孪生模型
语义特征提取
设计测试用例
数据互操作
数据格式