文本信息的提取方法、系统、设备以及存储介质

AITNT
正文
推荐专利
文本信息的提取方法、系统、设备以及存储介质
申请号:CN202410993484
申请日期:2024-07-23
公开号:CN118982832A
公开日期:2024-11-19
类型:发明专利
摘要
本说明书公开了一文本信息的提取方法、系统、设备以及存储介质,获取待处理的目标图像和针对该目标图像的目标问题文本,该目标图像携带文本信息,该目标问题文本用于指示从该目标图像中提取目标文本信息。对该目标图像进行文本识别,得到该目标图像对应的图像文本,该图像文本包括该目标图像中所携带的文本信息。将该目标图像、该图像文本以及该目标问题文本输入多模态处理模型,通过该多模态处理模型对该目标图像、该图像文本以及该目标问题文本进行处理,得到该目标文本信息,实现了对目标图像进行智能化的文本信息提取,在上述过程中,利用多模态处理模型的多模态理解能力,也即是利用不同模态的信息来进行文本信息提取,泛化能力较强。
技术关键词
嵌入特征 多模态 编码 文本信息提取 图像块特征 文本识别 注意力机制 计算机设备 输入模块 识别模块 可读存储介质 分词 处理器 存储器 分块
系统为您推荐了相关专利信息
1
无源主动领域自适应息肉半监督分割和分类系统及方法
样本 分类系统 半监督训练 分支 分类模型构建
2
一种CMS图像眩光抑制方法
眩光 智能模型 注意力 场景 解码器结构
3
一种风力涡轮机预测性维护方法及系统
采集风力涡轮机 深度学习预测模型 故障类别 Kalman滤波 多模态深度学习
4
用于双臂机器人的自主导航方法、装置及电子设备
三维环境模型 双臂机器人 动态障碍物 自主导航方法 注意力
5
基于数据处理的肿瘤患者肠内营养并发症监测方法和系统
聚合酶链式反应检测 肿瘤 患者 血液检测 时间段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号