改进Transformer模型、文本翻译方法和系统

AITNT
正文
推荐专利
改进Transformer模型、文本翻译方法和系统
申请号:CN202411369112
申请日期:2024-09-29
公开号:CN119167930A
公开日期:2024-12-20
类型:发明专利
摘要
本发明公开了一种改进Transformer模型、文本翻译方法和系统,该方法包含:对Multi30k机器翻译数据集进行解析,划分训练集、验证集、测试集。分别对英文文本和德文文本进行分词处理与词频统计;根据词频对分词按照索引进行编码从而构建词表;将原本的字符文本按照词表映射成数型编码;构建改进Transformer模型,改进Transformer模型包含自适应长短头注意力机制模块,自适应长短头注意力机制模块对输入向量的维度进行不等份划分;对改进Transformer模型进行训练;通过改进Transformer模型进行。本发明的改进Transformer模型、文本翻译方法和系统,将Transformer模型中的多头注意力机制模块替换成自适应长短头注意力机制模块,赋予多个注意力头不同长短的维度,使模型提取不同长短维度之间的特征信息。
技术关键词
文本翻译方法 词频统计 机器翻译 代表 训练集 文本翻译系统 分词 多头注意力机制 编码 数据处理模块 字符 索引
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号