一种用于采销系统的多模态OCR系统及方法

AITNT
正文
推荐专利
一种用于采销系统的多模态OCR系统及方法
申请号:CN202510823767
申请日期:2025-06-19
公开号:CN120747987A
公开日期:2025-10-03
类型:发明专利
摘要
本发明涉及多模态OCR技术领域,具体为一种用于采销系统的多模态OCR系统及方法,包括:图像采集模块,多模态特征提取模块,数据融合模块,识别与分析模块,反馈与优化模块;有益效果为:通过构建一种用于采销系统的多模态OCR系统,实现文本识别,其技术领域具有交叉性和综合性,广泛应用于企业生产中,极大提高办公自动化。多模态OCR涉及对图像中文本的检测、定位和识别,通过计算机视觉技术处理图像信息,利用模式识别算法提取文本特征,属于该领域的重要应用。该技术学习多模态数据与文本之间的映射关系,需要对识别出的文本进行语义理解和分析,以提高识别准确率和处理复杂文本场景。
技术关键词
OCR系统 视觉特征提取 语义特征提取 子模块 布局特征 多模态 高分辨率摄像头 迁移学习技术 特征提取模块 神经网络架构 图像采集模块 纸质文档 布局结构 分析模块 模式识别算法 提升系统 计算机视觉技术
系统为您推荐了相关专利信息
1
矩阵式负载的自适应调节方法、系统、设备及存储介质
排列算法 数据 传感 消息 电阻器件
2
一种基于云端AI控制的穿戴神经调控方法及系统
神经调控方法 调控设备 神经调控系统 人工智能模型 云端服务器
3
一种融合设计规则与视觉注意力机制的艺术素材美学评价方法与系统
视觉注意力机制 评价方法 视觉特征提取 多任务联合训练 局部视觉特征
4
一种播放器皮肤的生成方法、设备及存储介质
生成方法 播放器 视觉 图像识别模型 元素
5
基于多模态选择状态空间融合的智能合约漏洞检测方法
嵌入特征 卷积特征 文本 多模态 交互特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号