一种基于视觉-语言多模算法的大纲层级提取方法

正文

推荐专利

申请号：CN202510852656

申请日期：2025-06-24

公开号：CN120745560A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于视觉‑语言多模算法的大纲层级提取方法。本发明公开的方法通过视觉检测算法提取粗大纲，去除冗余信息以提高提取的准确性。随后，本发明结合多模态技术，采用视觉信息与语义信息融合的方式，实现大纲层级分类与编号输出，大幅提升处理效率与普适性，为复杂文档的结构化解析提供了一种高效解决方案。

技术关键词

层级视觉特征识别页面关键短语检测视觉检测算法格式文本检测模型多模态技术语义关键词语义特征提取插件机制节点分段图像语义向量

系统为您推荐了相关专利信息

交通标志识别地图构建方法车道检测卷积神经网络模型视觉特征

人形机器人识别特征多模态数据工业

配电网工程 CIM模型数据库构建方法节点层级

单据图谱节点深度强化学习货运

数据融合方法语义标签节点多尺度语义特征 LiDAR点云