利用深度学习实现PDF内文的高效语义理解方法

AITNT
正文
推荐专利
利用深度学习实现PDF内文的高效语义理解方法
申请号:CN202411511340
申请日期:2024-10-28
公开号:CN119360398A
公开日期:2025-01-24
类型:发明专利
摘要
本申请提供了利用深度学习实现PDF内文的高效语义理解方法,涉及语义理解技术领域,包括:解析建筑行业PDF多模态数据,学习模态结构化信息,构建分割提取模块,分割提取模块用于解析PDF模态分布并进行结构化信息提取;建立多模态结构化信息之间的对应识别关系,学习跨模态语义关联特征;根据跨模态语义关联特征,建立协同搜索关系,当协同搜索关系中的任一特征被触发时,根据协同搜索关系进行PDF内文搜索,并将搜索结果进行整合反馈。通过本申请可以解决现有技术中存在建筑行业PDF文档中多模态信息难以准确解析的技术问题,实现精准解析PDF文档中多模态信息的技术目标,达到提高信息查找和提取效率及准确度的技术效果。
技术关键词
语义理解方法 区域建议网络 多模态 关系 预训练模型 跨模态 表格 图纸 训练样本集 语义理解技术 文本识别 词语 图像分割模型 建筑 高层次 通道 掩膜数据
系统为您推荐了相关专利信息
1
一种基于协作学习与IoST数据的场景图生成方法
视觉特征 生成方法 语义向量 图片 场景
2
基于多模态外观特征的儿童ADHD辅助筛查系统
筛查系统 多任务卷积神经网络 特征提取模块 面部表情特征 数据采集模块
3
多模态成像系统和时差培养箱
照明模组 成像模组 多模态成像系统 图像采集器 聚光系统
4
一种包括坐标与属性信息的脆弱水印生成方法、装置
兴趣 水印生成方法 字符 地理信息安全技术 关系
5
地学数据的统一编码方法、装置、计算机设备和存储介质
统一编码方法 多模态 网格 术语 数据编码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号