文档图像的处理方法及装置

AITNT
正文
推荐专利
文档图像的处理方法及装置
申请号:CN202410961302
申请日期:2024-07-17
公开号:CN118522018B
公开日期:2024-11-29
类型:发明专利
摘要
本说明书实施例提供了文档图像的处理方法及装置,其中,一种文档图像的处理方法包括:在文档图像的解析过程中,一方面对文档图像中的图像块进行特征提取获得图像特征,基于虚拟文本特征与图像特征进行注意力计算并根据获得的注意力权重和图像特征计算注意力图像特征,另一方面对文档图像的解析任务文本进行特征提取获得文本特征,将两方面获得的文本特征与注意力图像特征进行拼接获得拼接特征并输入大模型,由大模型的处理模块按照文本特征对注意力图像特征进行图像解析处理获得图像解析结果,以此在多模态特征拼接的基础上实现文档图像的解析。
技术关键词
注意力 图像块 滑动窗口 拼接模块 计算机可执行指令 文本编码器 图像编码器 分辨率 图像特征提取 特征提取模块 模态特征 可读存储介质 处理器 矩阵 元素 语义
系统为您推荐了相关专利信息
1
基于图像切分的视觉模型推理方法及装置
推理方法 视觉 切片 列表 索引
2
脚本修正方法、装置、设备、介质和产品
脚本 编码向量 文本 注意力 修正方法
3
一种基于对比重建的时空车辆轨迹表征学习方法
表征学习方法 车辆轨迹数据 编码器 解码器 学生
4
基于特征融合的多阶段滚动轴承剩余寿命预测方法
剩余寿命预测模型 多尺度卷积神经网络 阶段 连续点 滚动轴承
5
一种基于人工智能的大健康定制化人才培养系统
多模态数据采集 实训模块 策略 条件生成对抗网络 噪声强度系数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号