摘要
本发明公开一种样式风格对齐的DOCX格式文档翻译系统,通过文档解析工具对DOCX格式文档进行解析,得到XML格式文本;对XML格式文本中每个Paragraph对象样式标签进行简化;将简化后XML格式文本送入大语言模型得到译文XML格式文本;对于每个译文XML格式文本进行XML标签完整性校验;若校验结果满足完整性要求,则按照译文XML格式文本的对应顺序还原原始样式标签;通过文档解析工具将还原后的译文XML格式文本生成译文DOCX格式文档。本发明有效解决了专业文档翻译中格式保真与翻译质量的平衡问题,显著提升了样式对齐准确率和翻译效率,特别适用于法律合同、技术手册等需要严格保留格式的专业文档翻译场景。
技术关键词
文档翻译系统
格式
样式
文本
大语言模型
解析工具
标签
对象
生成译文
风格
机器翻译
专业
手册
字母
场景
系统为您推荐了相关专利信息
混凝土预制构件
关系抽取方法
注意力机制
实体
门控循环单元
智能合约漏洞
语义
函数调用信息
大语言模型
融合全局信息
虚假信息检测方法
协同注意力
多维度特征提取
语义特征
多特征加权融合
图像信息提取方法
解码模型
文本
注意力模型
样本