摘要
本申请提供了一种流式文本翻译方法、计算机程序产品和电子设备,该方法包括:对源语言数据进行切分,生成流式数据;对流式数据进行翻译,得到目标流式数据,流式数据和目标流式数据构成数据集;基于衔接标识,对数据集进行重构,得到训练数据,衔接标识包括以下至少之一:等待标识、添加标识和修正标识,等待标识表征维持前文译文等待后续输入,添加标识表征在前文译文的后面添加当前译文,修正标识表征基于当前输入修正前文译文;根据训练数据,对第一大语言模型进行调整,得到目标翻译模型;利用目标翻译模型,对目标源语言数据进行翻译,得到目标翻译文本。本申请解决了现有技术中流式翻译的解码较为固定缺乏灵活性导致翻译质量较低的问题。
技术关键词
文本翻译方法
大语言模型
翻译模型
数据
标识
计算机程序产品
解码器
知识蒸馏技术
可读存储介质
重构
电子设备
语义结构
字符
处理器
存储器
指标
指令
系统为您推荐了相关专利信息
趋势预测方法
多元回归模型
气象
计算机存储介质
数据
高炉煤气利用率
动态数据集
案例库
决策系统
动态预测模型
集成芯片
标识符
校准功能
芯片校准方法
信号控制模块
数据采集管理方法
特征提取模型
多模态
数据采集管理系统
指标