一种基于智能文本检测的PDF优化翻译方法及系统

AITNT
正文
推荐专利
一种基于智能文本检测的PDF优化翻译方法及系统
申请号:CN202510965077
申请日期:2025-07-14
公开号:CN120893451A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供一种基于智能文本检测的PDF优化翻译方法,包含:步骤1:解析PDF文档,分别识别PDF文档中的文本区域和图像区域,提取所述PDF文档中文本区域的原生文本块及其结构化位置信息,步骤2:对图像区域的图像文本块进行光学识别,将识别结果与所述原生文本块合并为统一的结构化数据集;步骤3:采用窗口翻译策略结合上下文进行机器翻译,并提取目标译文;翻译时动态关联相邻文本块,并通过边界标记符界定目标文本范围;步骤4:根据目标译文长度动态优化文本布局,并将翻译结果回填至原始位置。本发明能够精准地将翻译文本无缝回填至原图像的相应位置,同时确保原图的内容不受遮挡,避免因文本覆盖导致的视觉混乱或信息丢失。
技术关键词
文本 翻译方法 图像 翻译系统 坐标 光学识别模块 计算机视觉算法 机器翻译模型 块边界 动态 布局 标记 策略 字体 输入结构 聚类算法 页面 覆盖层
系统为您推荐了相关专利信息
1
中压配电网目标网架组网方法、装置、计算机设备
网架 深度学习网络 传感器节点 粒子 矩阵
2
一种基于呼吸道图像的分割方法及系统
呼吸道 血管 分割方法 伪影 分割三维图像
3
一种基于多模态神经网络的口腔3D建模打印方法
CT影像数据 口腔牙齿模型 神经网络模型 打印方法 多模态
4
基于关键词权重匹配的数据分类方法及系统
数据分类方法 分类特征 字符 词语 神经网络模型
5
屏幕桌面的调整方法和车辆
氛围灯 内饰 环境光 桌面 颜色
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号