摘要
本发明提供一种标题识别、知识库构建方法、装置、电子设备和存储介质,标题识别方法包括:基于文档中各段落的文字内容和样式,确定输入文本;基于大型语言模型,应用输入文本,识别文档的标题信息。本发明提供的方法、装置、设备和介质,实现了全自动化的标题识别,以及全自动化的知识库构建;基于文档中各段落的文字内容和样式构建输入文本,使得大型语言模型在基于输入文本针对文档进行标题识别时,可以将文档中文字内容的语义以及文档中的样式结合起来,避免单独基于语义或者单独基于样式进行标题识别所存在的局限性,并且相较于针对每个页面的样式进行标题分析的方案,能够更好地参考文档的整体语义,从而提高标题识别的可靠性和准确性。
技术关键词
文本
知识库构建方法
识别方法
融合特征
样式
电子设备
处理器
计算机程序产品
语义
识别装置
存储器
层级
页面
介质
系统为您推荐了相关专利信息
文本检索系统
文本检索方法
语义
分词
生成展示内容
频域特征
视频
通道注意力机制
图像块特征
输出特征
心理健康评估方法
机器人聊天
数据
强度
心理健康评估系统