一种面向多语种文本图像的跨语种描述生成方法

AITNT
正文
推荐专利
一种面向多语种文本图像的跨语种描述生成方法
申请号:CN202411631533
申请日期:2024-11-15
公开号:CN119516548B
公开日期:2025-10-28
类型:发明专利
摘要
本发明公开了一种面向多语种文本图像的跨语种描述生成方法,其步骤包括:1获取多语种的文本图像并进行描述语句的标注;2构建面向多语种文本图像的跨语种描述生成网络;3构造多模态文本纠错任务的数据集,对描述生成网络中的部分模块进行预训练;4基于多语种文本图像描述生成数据集对网络的所有模块进行训练;5利用训练好的跨语种描述生成网络对任意输入的多语种文本图像生成指定语种的描述语句。本发明可以在多语种的场景下,对输入的多语种自然场景文本图像进行深度理解,输出多语种文本图像指定语种的描述语句。
技术关键词
信息编码 文本 生成方法 多模态 图像 视觉特征 序列 解码模块 识别标签 语句 字符分类器 更新网络参数 识别模块 语义 纠错 可读存储介质
系统为您推荐了相关专利信息
1
一种面阵相机自动视觉定位的DTG打印方法及系统
自动视觉定位 打印控制指令 面阵相机 打印方法 打印系统
2
基于语义分割的权值调整局部线性细节注入的全色锐化方法、系统、设备及介质
全色锐化方法 语义 标签 像素 模糊滤波器
3
一种物品属性问答方法和系统
问答知识库 问答方法 数据 生成知识 问答系统
4
全景影像处理方法、装置、相关设备及车辆
深度图 网格 影像 拍摄装置 生成全景
5
一种圆柱电池极组自动对中装配装置及其工作方法
双向驱动机构 机械夹持机构 磁悬浮机构 装配装置 圆柱电池
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号