摘要
本发明公开了一种基于草稿模型和多数投票的低延时大模型推理方法及系统,包括:收集用户问答请求,将用户问答请求转换为前缀序列,构建三元组;构建若干个草稿模型,每个草稿模型均至少包括一个三元组编码器和一个上下文编码器;将三元组分别输入每个草稿模型中,基于所有词元的三元组和问答模型的中间隐藏状态获取每个词元的特征编码文本;基于特征编码文本构建文本序列选择决策树,同时基于每个草稿模型的权重计算文本序列选择决策树中每个节点的权重,基于多数投票者机制选取最优的特征编码文本,问答模型基于最优的特征编码文本对用户问答请求进行处理。本发明利用多个草稿模型共同推测输出,提高了推理性能,显著降低了维护成本和复杂度。
技术关键词
问答模型
三元组
推理方法
编码器
文本
存储模块
序列
评测方法
输入端
推理系统
解码器
节点
表达式
机制
度量
复杂度
非线性
系统为您推荐了相关专利信息
高精度倾斜仪
机械转台
人机交互软件
高精度编码器
实时数据采集
多模态特征
自动生成方法
归一化植被指数
多尺度特征金字塔
分支
文本生成方法
目录
大语言模型
文本生成系统
元素
视觉算法
文本区域检测
文本识别模型
抑制算法
集装箱号码识别
关键词
政务
BERT模型
问答方法
构建知识图谱