摘要
本发明提出一种大语言模型表格理解能力的训练方法,通过能够对表格有效信息进行压缩,同时保留下对效果有提升的行列信息,提效同时效果也能提升,提效体现在同样的表格内容用此种表示形式,所需要的token数通常较少,那么参与训练和推理的token数也会更少,是对算力更高效的利用,考虑了表格理解的三大部分能力,即表格读表、数值推理、数据分析,进一步提升对正确答案的生成概率,也就是减少由于概率导致的错误答案生成。本发明提升了表格理解的准确性,且通过表格数据有效表示优化提升转token后的信息密度,从而提升表格数据训练和推理的效率。
技术关键词
大语言模型
表头
生成答案
数值
数据
生成表格
指令
变量
关键词
模板
定义
基础
编辑
文本
密度
系统为您推荐了相关专利信息
水云模型
极化分解特征
叶面积指数
土壤水分反演方法
参数
异常分析方法
环卫行业
多模态特征融合
因子
能耗分析技术
高密度互连印刷电路板
YOLO模型
缺陷检测系统
卷积模块
缺陷检测方法
配货方法
商品特征
编码规则
计算机科学技术
配货设备
电子设备
显示多任务界面
图像显示模块
背景图
芯片系统