一种基于智能文本检测的PDF优化翻译方法及系统

AITNT
正文
推荐专利
一种基于智能文本检测的PDF优化翻译方法及系统
申请号:CN202510965077
申请日期:2025-07-14
公开号:CN120893451A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供一种基于智能文本检测的PDF优化翻译方法,包含:步骤1:解析PDF文档,分别识别PDF文档中的文本区域和图像区域,提取所述PDF文档中文本区域的原生文本块及其结构化位置信息,步骤2:对图像区域的图像文本块进行光学识别,将识别结果与所述原生文本块合并为统一的结构化数据集;步骤3:采用窗口翻译策略结合上下文进行机器翻译,并提取目标译文;翻译时动态关联相邻文本块,并通过边界标记符界定目标文本范围;步骤4:根据目标译文长度动态优化文本布局,并将翻译结果回填至原始位置。本发明能够精准地将翻译文本无缝回填至原图像的相应位置,同时确保原图的内容不受遮挡,避免因文本覆盖导致的视觉混乱或信息丢失。
技术关键词
文本 翻译方法 图像 翻译系统 坐标 光学识别模块 计算机视觉算法 机器翻译模型 块边界 动态 布局 标记 策略 字体 输入结构 聚类算法 页面 覆盖层
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号