一种基于分层滑动窗口机制的长文本生成方法及系统

正文

推荐专利

申请号：CN202510861607

申请日期：2025-06-25

公开号：CN120354893A

公开日期：2025-07-22

类型：发明专利

摘要

本申请公开了一种基于分层滑动窗口机制的长文本生成方法及系统，涉及自然语言处理和深度学习技术领域，其中，该方法包括：构建Transformer模型，Transformer模型包含多层Transformer块；基于预设分层滑动窗口设定策略确定各Transformer块的窗口大小，并构成优化后的Transformer模型；对优化后的Transformer模型进行训练，并基于训练后的Transformer模型进行长文本处理。本申请解决了传统Transformer架构因固定注意力范围导致的长距依赖捕捉不完整与计算资源浪费的问题，可以用于自然语言处理、文本生成、机器翻译等领域。

技术关键词

滑动窗口机制文本生成方法优化器模型训练模块文本生成系统自然语言分层深度学习技术策略参数多层感知机机器翻译注意力动态基础数据

系统为您推荐了相关专利信息

一种辐射源跨域个体识别方法及系统

多尺度特征提取特征提取单元教师学生卷积模块

一种对影响梯级水库调度运行的事件的预测方法

梯级水库调度实时监测数据数据分析模型标签预警规则

车辆自动升级方法及装置、升级时间确定模型的训练方法

时间段升级方法数据车辆识别码模型训练模块

跨地区的商品编码映射方法、系统、存储介质及电子设备

编码映射方法跨地区模型训练模块分词电子设备

基于卷积神经网络的雷达仙波点迹抑制方法

回波训练卷积神经网络优化网络参数点迹特征构建训练集

一种基于分层滑动窗口机制的长文本生成方法及系统

站点导航

APP 下载