一种文档切分方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
一种文档切分方法、装置、计算机设备及存储介质
申请号:CN202411506192
申请日期:2024-10-25
公开号:CN119474250A
公开日期:2025-02-18
类型:发明专利
摘要
本申请属于人工智能和金融科技领域,涉及一种文档切分方法,包括对待切分文档进行样式特征识别和标题文本识别,得到标题样式结果和标题文本结果,然后通过多模态标题识别大模型对标题样式结果和标题文本结果进行识别校验,得到最终的标题识别结果,基于标题识别结果构建树形层级表示,得到文档章节结构,并根据文档章节结构对待切分文档进行切分。本申请还提供一种文档切分装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,待切分文档可存储于区块链中。本申请实现了将文档以章节形式切分,保证切分语义完整性,有效提取并结构化关键信息。
技术关键词
文本识别 样式 注意力 计算机可读指令 层级 视觉特征提取 融合特征 文本行 切分装置 多模态 计算机设备 语义向量 定位框 语义特征 生成树 解码器 跨模态 关系
系统为您推荐了相关专利信息
1
一种泛在网络多模态隐私数据保护方法
隐私数据保护方法 零知识证明 判别特征 客户端 高维特征向量
2
一种基于区块链的药品供应链溯源系统
防伪溯源 供应链溯源系统 区块链智能合约 真实性验证 注意力
3
一种无人机巡检风机叶片损伤快速识别方法
快速识别方法 无人机巡检 风机叶片 图像编码器 全局特征提取
4
基于N-LOSAM2网络的视网膜血管分割方法
视网膜眼底图像 血管分割 图像校正 图像编码器 视网膜结构
5
一种城乡物流无人驾驶配送系统
配送系统 动态路径优化 异构传感器网络 系统控制 多模态环境
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号