摘要
本申请实施例公开了一种分块方法,包括:获取文档结构树,基于文档结构树的节点的标识,获取当前节点,在当前节点的数据量小于或者等于预设阈值的情况下,将目标节点对应的文档内容,分为第一数据块,目标节点为:当前节点至当前节点的叶子节点的所有节点,当前节点的数据量为:目标节点对应的文档内容的数据量,在当前节点的数据量大于预设阈值的情况下,基于当前节点,对文档结构树的文档内容进行语义分块,得到至少两个第二数据块,第二数据块的数据量小于或等于预设阈值。本申请实施例还同时提供了一种分块装置及电子设备。
技术关键词
节点
分块方法
数据
语义
标识
表格
电子设备
处理器
文本
模块
表头
指令
图片
系统为您推荐了相关专利信息
冗余数据处理方法
预训练模型
高温度
数据输入模块
数据处理系统
文本分析模型
资料查询方法
向量空间模型
生成标签
序列
智能标签系统
显示信息
触摸屏显示器
移动终端
通信模块
自动化物流输送线
调度优化方法
序列
多智能体协同
多源运行数据
融合特征
识别方法
图像特征提取方法
可见光图像
深度残差网络模型