基于多级投机采样的大语言模型推理方法、装置及设备

AITNT
正文
推荐专利
基于多级投机采样的大语言模型推理方法、装置及设备
申请号:CN202411874739
申请日期:2024-12-18
公开号:CN119831036A
公开日期:2025-04-15
类型:发明专利
摘要
本申请公开了基于多级投机采样的大语言模型推理方法、装置及设备,涉及人工智能技术领域,方法包括:若与输入文本匹配的第一草稿经过修改,则将第一草稿输入到生成第一草稿的目标层级草稿模型;利用第一草稿当前所处层级的草稿模型根据第一草稿生成第二草稿;将第二草稿输入到下一层级草稿模型,并判断下一层级草稿模型是否对第二草稿作出修改;若第二草稿经过修改,则返回生成第二草稿的步骤;或,若第二草稿未经过修改,则返回判断第二草稿是否被修改的步骤,直至最后层级草稿模型生成的第二草稿通过原始模型的评估。本申请无需从第一层级草稿模型开始逐级推理,且通过多个层级的草稿模型增强最终草稿的生成质量,可提高推理效率。
技术关键词
推理方法 层级 文本 推理装置 可读存储介质 人工智能技术 电子设备 处理器 数据 存储器 计算机
系统为您推荐了相关专利信息
1
一种分布式交易的偏差电量处理方法、系统、设备及介质
发电量 偏差 支持向量机算法 分布式电源发电 价格型需求响应
2
基于地质雷达数据的道床厚度识别方法及装置
地质雷达 滑动窗口 反射面 位线 面点
3
基于古文文本信息挖掘的古建筑神经稀疏体素场3D模型重建方法、装置及存储介质
模型重建方法 图像 文本 相机 序列帧
4
自动对焦方法、装置、设备、介质及系统
液体透镜 计算机执行指令 电子设备 搜索算法 图像采集模块
5
一种发电机减振调试方法、装置、设备及介质
发电机系统 弹性支撑系统 调试方法 刚度 拉丁超立方抽样方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号