一种基于视觉-语言多模算法的大纲层级提取方法

AITNT
正文
推荐专利
一种基于视觉-语言多模算法的大纲层级提取方法
申请号:CN202510852656
申请日期:2025-06-24
公开号:CN120745560A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种基于视觉‑语言多模算法的大纲层级提取方法。本发明公开的方法通过视觉检测算法提取粗大纲,去除冗余信息以提高提取的准确性。随后,本发明结合多模态技术,采用视觉信息与语义信息融合的方式,实现大纲层级分类与编号输出,大幅提升处理效率与普适性,为复杂文档的结构化解析提供了一种高效解决方案。
技术关键词
层级 视觉特征 识别页面 关键短语检测 视觉检测算法 格式 文本检测模型 多模态技术 语义关键词 语义特征提取 插件机制 节点 分段 图像 语义向量
系统为您推荐了相关专利信息
1
融合交通标志识别、车道检测和规则整合的地图构建方法以及系统
交通标志识别 地图构建方法 车道检测 卷积神经网络模型 视觉特征
2
一种人形机器人多模态数据处理方法、系统、设备及介质
人形机器人 识别特征 多模态 数据 工业
3
面向CIM的图数据库构建方法、系统、设备和存储介质
配电网工程 CIM模型 数据库构建方法 节点 层级
4
多级单据依赖的货运试算数据联动计算方法及系统
单据 图谱 节点 深度强化学习 货运
5
一种基于动态建模的多精度三维测绘数据融合方法
数据融合方法 语义标签 节点 多尺度语义特征 LiDAR点云
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号