多模态数据的结构化分解及信息识别方法、介质及设备

AITNT
正文
推荐专利
多模态数据的结构化分解及信息识别方法、介质及设备
申请号:CN202511187849
申请日期:2025-08-25
公开号:CN121033879A
公开日期:2025-11-28
类型:发明专利
摘要
本申请提供一种多模态数据的结构化分解及信息识别方法、介质及设备,方法包括:获取待处理的多模态文献数据,多模态文献数据为文档或图片,文档的类型包括word文档和PDF文档;将待处理的多模态文献数据转换为图像形式的待处理文献数据并进行预处理,得到输入图像数据,输入至领域微调DETR模型,通过领域微调DETR模型识别输入图像数据的逻辑区域类别,得到区域类别识别结果并输出,逻辑区域类别包括标题区域、作者区域、摘要区域、正文区域、插图区域、表格区域、公式区域、页脚区域和参考文献区域;对每个区域类别识别结果进行差异化信息提取,得到每个区域类别识别结果对应的信息,以实现对多模态数据中信息的准确识别。
技术关键词
信息识别方法 识别置信度 对象 文本识别方法 置信度阈值 数据 多模态 芳香环 图像 表格 手性中心 邻居 分子 逻辑 电子设备 摘要 聚类算法 文本行
系统为您推荐了相关专利信息
1
一种应用于NFS云存储网关的并行数据访问方法及装置
并行数据访问方法 无锁队列 客户端 条带 云存储
2
由电子设备执行的交互方法、装置、电子设备、存储介质、系统和计算机程序产品
电子设备 交互方法 虚拟对象 物体 交互装置
3
一种基于YOLO的鲁棒角点的快速检测方法
快速检测方法 图像 YOLO模型 边缘检测 像素
4
基于人工智能的用电管理方法、装置、能源管理系统
智能开关 状态检测设备 人工智能模型 能源管理系统 管理方法
5
基于DSP的智能目标跟踪数据分析系统及方法
数据分析方法 对象 视觉特征提取 边缘形状特征 数据分析系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号