摘要
本发明公开了一种基于上下文信息融合的试卷结构元素类型识别方法,包括:对输入的试卷文档进行预处理,获得试卷文档中的多行文本;针对多行文本中的目标行文本,提取目标行文本的前N行文本和后N行文本,作为目标行文本的上下文信息;将前N行文本、目标行文本和后N行文本进行拼接,并将拼接结果输入至微调后的大语言模型中,输出目标行文本所属的类别。该方法基于上下文信息使模型更好地理解试卷整体结构逻辑,提高试卷结构元素识别准确度。
技术关键词
试卷结构
识别方法
大语言模型
文本行
元素
标签
超参数
序列
答案
列表
逻辑
数据
信号
系统为您推荐了相关专利信息
预训练语言模型
语音识别方法
自然语言理解模型
查询意图
语音识别系统
监督学习模型
分类器
岩性识别方法
编码器
图像特征向量
语音控制指令
电子设备控制方法
页面信息处理
元素
控制终端
自动生成系统
大语言模型
报告
企业
金融风险评估技术
综合管理系统
智能后处理
识别方法
图像处理
深度学习模型