摘要
本申请公开了一种模型获取方法、标题信息识别方法、相关装置及相关系统,其中,模型获取方法包括:获取第一训练数据,第一训练数据包括标注有标题信息的第一训练文本以及第一训练文本对应的真实Markdown文本;利用第一训练数据,结合标题信息识别任务和Markdown文本生成任务,进行多任务模型的训练,训练好的多任务模型作为标题信息识别模型或文本结构化模型。本申请公开的模型获取方法通过联合标题信息识别任务和Markdown文本生成任务进行训练,可获得具有较好的标题信息识别效果和文本结构化效果的模型,利用本申请公开的模型获取方法获得的模型进行标题信息识别,可获得较为准确的标题信息识别结果。
技术关键词
模型获取方法
文本
信息识别方法
位置识别
信息识别装置
层级
计算机可读指令
模型训练模块
电子设备
教师
数据获取模块
学生
采编系统
计算机存储介质
存储计算机程序
解码器
计算机程序产品
编码器
处理器
系统为您推荐了相关专利信息
文本特征向量
分类预测方法
局部结构特征
结构生成对抗网络
重建误差
面向多模态数据
文本特征向量
知识抽取方法
图像特征向量
多模态特征融合