多模态文档结构化处理方法、装置、设备及介质

AITNT
正文
推荐专利
多模态文档结构化处理方法、装置、设备及介质
申请号:CN202510126948
申请日期:2025-01-27
公开号:CN120068810A
公开日期:2025-05-30
类型:发明专利
摘要
本申请公开了一种多模态文档结构化处理方法、装置、设备及介质。针对从待处理文档中提取到的不同其他数据类型,可以根据预设的该其他数据类型对应的结构化处理步骤,对该其他数据类型的数据进行结构化处理,从而实现深度挖掘该其他数据类型的数据所携带的信息,以及多模态数据的有效整合与利用,将待处理文档中的各其他数据类型的数据所携带的信息以统一的、结构化的形式呈现出来。对于图像数据,通过区分文字图像类型和非文字图像类型并采取不同的处理方式,使得对图像数据中携带的信息提取更加精准。对于表格数据,通过获取表头名称、行名称,并为每个数据项生成描述性文本,将表格数据从简单的数值矩阵转化为具有丰富语义的信息集合。
技术关键词
数据项 表格 文本 多模态 图像内容识别 表头 自然语言 计算机设备 处理单元 处理器 关系 可读存储介质 语义 存储器 矩阵 数值
系统为您推荐了相关专利信息
1
一种基于双重样本筛选的回放增量学习方法
文本分类模型 增量学习方法 样本 聚类算法 内存
2
一种多模态融合的开关柜温度反演方法、设备及存储介质
开关柜温度 反演方法 多模态 LSTM模型 内部温度传感器
3
货物类型分类方法、装置、设备、存储介质及产品
分类方法 大语言模型 Word2Vec模型 货物分类技术 计算机程序产品
4
一种钢铁行业智能制造标准的知识图谱表示方法和表示平台
命名实体识别模型 服务端 客户端 词典 搜索算法
5
基于深度学习的海上风电机组一机一档校核方法
海上风电机组 校核方法 构建深度神经网络 视频监控数据 识别设备运行状态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号