摘要
本发明公开了一种基于材料数据提取的大语言模型的约束控制输出算法,涉及自然语言处理技术领域,包括片段输出算法和选择性采样算法。片段输出算法通过预定义JSON模板并拆分为片段,结合逐片段生成方式降低显存占用与计算复杂度;选择性采样算法通过对模型前向传播中的logits进行掩码处理,屏蔽无关Token,确保仅输出所需值内容。本发明解决了现有技术中格式漂移、计算效率瓶颈及泛化能力不足的问题,在无需微调的情况下实现严格格式化输出,适用于超长序列生成场景,并显著提升工业应用中的自动化效率。
技术关键词
算法
大语言模型
掩码矩阵
资源受限环境
写入存储介质
格式化
模板
生成场景
数据
生成规则
生成方式
复杂度
自然语言
字段
序列
状态机
符号
列表
标识符
系统为您推荐了相关专利信息
医学影像文件
分布式存储模块
节点
分布式文件系统
医学影像数据存储
数据完整性保护
楼宇自控系统
主控制器
连续性
冗余
检测信号灯
故障检测装置
接口面板
交通信号灯
单片机控制器