一种基于大模型的语言翻译数据处理方法及系统

正文

推荐专利

申请号：CN202510264085

申请日期：2025-03-06

公开号：CN120258010A

公开日期：2025-07-04

类型：发明专利

摘要

本申请提供了一种基于大模型的语言翻译数据处理方法及系统，通过对语言翻译数据进行编码分段，得到多个文本片段；对每个文本片段进行依存句法分析，确定每个文本片段的依存树结构，根据每两个文本片段之间的语义相似度和对应文本片段的依存树结构确定每两个文本片段之间显式语义的依赖关系；根据各个文本片段之间隐式语义的关联度和各个文本片段的分段损失对每两个文本片段之间的隐式语义关系进行依赖分析，得到每两个文本片段之间隐式语义的依赖关系；通过每两个文本片段之间显式语义和隐式语义的依赖关系构建语言翻译数据的段落标签，基于段落标签进行待翻译数据的翻译处理。采用本申请的方案，可实现长复杂文本的跨段语义指导翻译。

技术关键词

文本翻译数据处理方法依存句法分析语义特征提取分段皮尔逊相关系数标签计算机设备编码补偿值数据处理系统可读存储介质句法结构处理器模块存储器

系统为您推荐了相关专利信息

融合语义图的向量数据库问答处理方法、设备及存储介质

语义数据库融合语义答案文本路径搜索算法

一种基于大语言模型的经验学习自适应预瞄控制方法

大语言模型货架托盘记忆轨迹场景

在文本到图像扩散模型上学习用于3D感知图像生成的连续控制

图像生成模型训练集非暂态计算机可读介质生成训练图像令牌

一种用于集成多模态行人再识别的跨模态分组对齐方法

行人再识别文本对齐方法细粒度特征图像特征提取

集群自动化管理方法及系统

转换组件集群自动化管理方法校验信息自动化管理系统

一种基于大模型的语言翻译数据处理方法及系统

站点导航

APP 下载