摘要
本发明涉及人工智能技术领域,具体提供了一种基于改进混合专家架构的大语言模型的数据处理方法。该方法包括:将输入的查询信息通过语义理解模块进行处理,得到理解结果;基于理解结果以及预存的知识图谱,将查询信息发送给对应的多个专家模型,由专家模型得到对应的输出结果,多个专家模型基于改进混合专家架构设置有多层,不同层的专家模型是根据不同专家维度划分得到的;对多个专家模型的输出结果,进行融合处理,得到查询信息对应的回答结果。以解决相关技术中混合专家架构的大语言模型,在专业细分领域的精确性较低,解决问题能力差的问题。
技术关键词
数据处理方法
冗余度
图谱
专业
筛选算法
人工智能技术
求解算法
计算机程序产品
处理器
注意力
语义特征
纠错
模块
节点
参数
电子设备
指令
系统为您推荐了相关专利信息
大语言模型
工作流
json格式数据
生成结构化数据
文本
LED屏
舞台
显示控制方法
环境感知数据
多模态
体构建方法
多任务
混合专家网络
行业知识图谱
多模态数据采集