摘要
本申请属于人工智能和金融科技领域,涉及一种文档切分方法,包括对待切分文档进行样式特征识别和标题文本识别,得到标题样式结果和标题文本结果,然后通过多模态标题识别大模型对标题样式结果和标题文本结果进行识别校验,得到最终的标题识别结果,基于标题识别结果构建树形层级表示,得到文档章节结构,并根据文档章节结构对待切分文档进行切分。本申请还提供一种文档切分装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,待切分文档可存储于区块链中。本申请实现了将文档以章节形式切分,保证切分语义完整性,有效提取并结构化关键信息。
技术关键词
文本识别
样式
注意力
计算机可读指令
层级
视觉特征提取
融合特征
文本行
切分装置
多模态
计算机设备
语义向量
定位框
语义特征
生成树
解码器
跨模态
关系
系统为您推荐了相关专利信息
隐私数据保护方法
零知识证明
判别特征
客户端
高维特征向量
防伪溯源
供应链溯源系统
区块链智能合约
真实性验证
注意力
快速识别方法
无人机巡检
风机叶片
图像编码器
全局特征提取
视网膜眼底图像
血管分割
图像校正
图像编码器
视网膜结构
配送系统
动态路径优化
异构传感器网络
系统控制
多模态环境