图像文本特征对齐融合的信息抽取方法、设备及程序产品

AITNT
正文
推荐专利
图像文本特征对齐融合的信息抽取方法、设备及程序产品
申请号:CN202411122940
申请日期:2024-08-15
公开号:CN119250189B
公开日期:2025-10-28
类型:发明专利
摘要
本发明提供一种图像文本特征对齐融合的信息抽取方法、设备及程序产品,方法包括:将目标图像输入图像特征提取模型得到图像特征;检测识别目标图像中的文本块,得到文本块识别结果;将文本块识别结果输入文本特征提取模型,得到文本特征;基于文本块识别结果构建文本块特征,将文本特征与图像特征桥接对齐;将文本特征和图像特征输入特征融合模型进行拼接,得到综合特征向量;特征融合模型包括自编码器和变压器编码器;将综合特征向量分类输入预设分类器,执行语义实体识别任务,确定文本块对应的分类结果,基于分类结果,执行关系抽取任务;能够解决在处理含有复杂背景和多元素的图像时,信息提取不准确的问题。
技术关键词
文本 图像特征提取模型 编码器 信息抽取方法 语义实体 特征提取网络 视觉特征 特征金字塔网络 答案 变压器 分类器 语义特征 指令 索引 样本 残差学习 计算机程序产品 处理器
系统为您推荐了相关专利信息
1
一种集成存储、扩展坞与摄影辅助功能的智能设备
摄影辅助功能 智能设备 风道板 接口模块 控制模块
2
一种声调评估康复训练装置及系统
康复训练系统 康复训练装置 预训练模型 电极片 降噪耳机
3
跨域耕地提取方法、装置、设备、存储介质及程序产品
耕地提取方法 图像分割模型 预训练模型 语义 影像
4
一种基于语义指导多模态融合的小样本动作识别方法
动作识别方法 视觉特征 样本 多模态 语义
5
基于金豺狼优化算法的变压器故障诊断方法
分类准确率 重构误差 降噪特征 表达式 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号