摘要
本发明涉及一种基于上下文学习模型表征的大语言模型动态路由方法和设备、可读存储介质,利用投影模型将查询嵌入映射到语言模型输入空间并实现语义对齐,再从基准题库中自动筛选覆盖多维能力的代表性评估集,一次性高效获取模型在评估集上的表现特征,形成高质量的上下文模型能力表征;随后结合实时查询嵌入与上下文模型能力表征,使用轻量级路由语言模型进行监督学习,从而实现细粒度模型区分能力,并设计增量嵌入更新机制,在新模型接入或旧模型升级时,仅通过极少量固定题目即可快速完成冷启动,大幅降低计算与维护成本,有效提升了模型路由的准确性、实时性及灵活扩展性。
技术关键词
投影模型
路由器
动态
非线性神经网络
知识问答系统
细粒度模型
可读存储介质
查询重构
语义
大语言模型
推荐系统
注意力机制
电子设备
程序
标签
层级
信息熵
正确率
存储器
处理器
系统为您推荐了相关专利信息
变电站接地网故障
识别器
定位方法
可编程增益放大器
信号增益控制
协同优化系统
拼接模块
全局地图
拼接误差
词袋模型
园区综合能源系统
分析模块
代表
优化装置
动态反馈系统
能量传输单元
定位方法
多线圈阵列
接收线圈
无线充电环境
仿真模型
输入输出接口
飞行状态数据
航空飞行仿真技术
数据通信模块