基于草稿模型和多数投票的低延时大模型推理方法及系统

AITNT
正文
推荐专利
基于草稿模型和多数投票的低延时大模型推理方法及系统
申请号:CN202410768412
申请日期:2024-06-14
公开号:CN118761469A
公开日期:2024-10-11
类型:发明专利
摘要
本发明公开了一种基于草稿模型和多数投票的低延时大模型推理方法及系统,包括:收集用户问答请求,将用户问答请求转换为前缀序列,构建三元组;构建若干个草稿模型,每个草稿模型均至少包括一个三元组编码器和一个上下文编码器;将三元组分别输入每个草稿模型中,基于所有词元的三元组和问答模型的中间隐藏状态获取每个词元的特征编码文本;基于特征编码文本构建文本序列选择决策树,同时基于每个草稿模型的权重计算文本序列选择决策树中每个节点的权重,基于多数投票者机制选取最优的特征编码文本,问答模型基于最优的特征编码文本对用户问答请求进行处理。本发明利用多个草稿模型共同推测输出,提高了推理性能,显著降低了维护成本和复杂度。
技术关键词
问答模型 三元组 推理方法 编码器 文本 存储模块 序列 评测方法 输入端 推理系统 解码器 节点 表达式 机制 度量 复杂度 非线性
系统为您推荐了相关专利信息
1
一种拓展高精度倾斜仪有效测量范围的方法及系统
高精度倾斜仪 机械转台 人机交互软件 高精度编码器 实时数据采集
2
一种多模态特征数据融合的小麦氮素处方图自动生成方法
多模态特征 自动生成方法 归一化植被指数 多尺度特征金字塔 分支
3
基于大语言模型的文本生成方法和系统
文本生成方法 目录 大语言模型 文本生成系统 元素
4
基于视觉算法的集装箱号码识别方法、装置及设备
视觉算法 文本区域检测 文本识别模型 抑制算法 集装箱号码识别
5
一种基于知识图谱的政务政策问答方法及相关设备
关键词 政务 BERT模型 问答方法 构建知识图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号