摘要
本发明提供一种基于智能文本检测的PDF优化翻译方法,包含:步骤1:解析PDF文档,分别识别PDF文档中的文本区域和图像区域,提取所述PDF文档中文本区域的原生文本块及其结构化位置信息,步骤2:对图像区域的图像文本块进行光学识别,将识别结果与所述原生文本块合并为统一的结构化数据集;步骤3:采用窗口翻译策略结合上下文进行机器翻译,并提取目标译文;翻译时动态关联相邻文本块,并通过边界标记符界定目标文本范围;步骤4:根据目标译文长度动态优化文本布局,并将翻译结果回填至原始位置。本发明能够精准地将翻译文本无缝回填至原图像的相应位置,同时确保原图的内容不受遮挡,避免因文本覆盖导致的视觉混乱或信息丢失。
技术关键词
文本
翻译方法
图像
翻译系统
坐标
光学识别模块
计算机视觉算法
机器翻译模型
块边界
动态
布局
标记
策略
字体
输入结构
聚类算法
页面
覆盖层
系统为您推荐了相关专利信息
CT影像数据
口腔牙齿模型
神经网络模型
打印方法
多模态