基于多级分类标引的公文文档智能切片处理方法及系统

正文

推荐专利

申请号：CN202510764975

申请日期：2025-06-10

公开号：CN120656187A

公开日期：2025-09-16

类型：发明专利

摘要

本发明公开了基于多级分类标引的公文文档智能切片处理方法及系统，涉及公文文档切片处理技术领域，包括通过API接口获取公文文档的扫描件进行预处理，得到图像页面；使用PyTorch加载Swin‑B模型，并将图像页面作为输入，输出特征图进行划分，并定义为条带，利用平均池化操作压缩条带的高度维度，并结合L2范数计算条带的横向特征密度，使用网格生成法生成条带内像素点坐标，并通过poly2mask函数生成条带的空间掩膜，结合指示函数进行像素点筛选，计算距离权重，并构建加权核函数后结合特征密度，筛选有效条带；本发明显著提升了切片结果的完整性与准确性。

技术关键词

文本特征向量 Viterbi算法切片条带横向特征语义向量注意力初始聚类中心像素点定义输出特征标签页面视觉序列 BERT模型基础图像

系统为您推荐了相关专利信息

一种解决智能合约版本演化中编译错误的方法及系统

补丁 Solidity智能合约代码切片生成代码分析工具

一种植入辅助三维成形方法

定位辅助结构成型元件三维成形方法成形部件粉末床

一种马铃薯干物质含量预测方法、设备、介质及产品

马铃薯干物质成分含量机器学习模型融合特征偏最小二乘回归模型

一种融合网络切片资源调度方法、系统、智能终端和介质

资源分配策略资源调度模型网络切片资源 5G网络切片网络模块

一种基于大数据分析的电商管理方法及系统

电商管理方法多状态滑动时间窗口网络时序

基于多级分类标引的公文文档智能切片处理方法及系统

站点导航

APP 下载