摘要
本发明涉及一种基于Bert的学术论文标题分级装置和方法,分级装置包括数据读取模块、特征融合模块、分级预测模块、动态上下文扩展模块和结构化标题树构建模块;其中,特征融合模块提取布局特征并归一化,然后将其线性投影后,复制到对应的标题文本块经分词后所有token对应的嵌入位置;最后将复制后的布局特征向量与对应token的文本嵌入向量在特征维度上拼接,并将拼接后的高维特征降维融合,输出融合多模态信息的嵌入向量;分级预测模块内置应用YARN算法分阶段训练后的分级模型,分级模型采用分阶段训练策略,为针对不同的目标上下文长度范围设定不同的旋转位置编码的基频参数和缩放因子。本发明分类准确率高,分类速度快。
技术关键词
融合多模态信息
文本
分级装置
分阶段
编码
动态上下文
数据读取模块
布局特征
因子
线性
序列
层级
扩展模块
页面宽度
页面高度
参数
电子设备
系统为您推荐了相关专利信息
智能家居设备
智能家居平台
智能家居管理方法
正态分布曲线
智能家居管理系统
图像预测方法
分析图像数据
面部
编码器特征
图像编码器
防伪方法
池化特征
人脸识别模型
卷积模块
图像分割