一种基于多目标优化文献结构分析方法

正文

推荐专利

一种基于多目标优化文献结构分析方法

申请号：CN202410833050

申请日期：2024-06-26

公开号：CN118379756A

公开日期：2024-07-23

类型：发明专利

摘要

本发明公开了一种基于多目标优化文献结构分析方法，涉及人工智能技术领域。包括对文档图提取文档图像中的位置编码特征和图像序列特征，在Transformer层中利用其自注意力机制捕捉文档中每个像素的上下文信息，输出文档结构的多维特征序列；将多维特征序列送入由多层感知器分类器层和线性层组成的两头部结构中，进行文档实例的语义类别预测，并动态生成用于遮罩预测的卷积核；利用逐层特征聚合模块对多维特征序列组合并形成统一的遮罩特征映射；在统一的遮罩特征映射上，基于生成的卷积核执行动态卷积操作，为文档图像的每个分块生成实例遮罩。本发明实现复杂文档布局中元素的实例级分割，彰显了其在实际应用中的可靠性和创新价值。

技术关键词

结构分析方法多层感知器图像序列特征编码特征特征金字塔网络多头注意力机制分类器分块人工智能技术动态语义矩阵像素线性模块元素

系统为您推荐了相关专利信息

基于双重跨模态注意力的表情运动单元检测方法

局部视觉特征全局视觉特征跨模态节点交互特征

一种基于深度学习的浮动目标三维重构方法

三维重构方法特征点集合剔除误匹配特征点三维结构动态

电气设备自动化控制方法及系统

双臂机器人双面缺陷电气设备自动化指令数据

一种会议进程控制方法、装置、设备及介质

发言人进程控制方法生成字幕 AI服务器进程控制装置

一种基于单目惯导视觉语义信息的定位方法

定位方法卡尔曼滤波算法语义分割模型误差状态单目摄像头

一种基于多目标优化文献结构分析方法

站点导航

APP 下载