一种基于分层滑动窗口机制的长文本生成方法及系统

AITNT
正文
推荐专利
一种基于分层滑动窗口机制的长文本生成方法及系统
申请号:CN202510861607
申请日期:2025-06-25
公开号:CN120354893A
公开日期:2025-07-22
类型:发明专利
摘要
本申请公开了一种基于分层滑动窗口机制的长文本生成方法及系统,涉及自然语言处理和深度学习技术领域,其中,该方法包括:构建Transformer模型,Transformer模型包含多层Transformer块;基于预设分层滑动窗口设定策略确定各Transformer块的窗口大小,并构成优化后的Transformer模型;对优化后的Transformer模型进行训练,并基于训练后的Transformer模型进行长文本处理。本申请解决了传统Transformer架构因固定注意力范围导致的长距依赖捕捉不完整与计算资源浪费的问题,可以用于自然语言处理、文本生成、机器翻译等领域。
技术关键词
滑动窗口机制 文本生成方法 优化器 模型训练模块 文本生成系统 自然语言 分层 深度学习技术 策略 参数 多层感知机 机器翻译 注意力 动态 基础 数据
系统为您推荐了相关专利信息
1
一种辐射源跨域个体识别方法及系统
多尺度特征提取 特征提取单元 教师 学生 卷积模块
2
一种对影响梯级水库调度运行的事件的预测方法
梯级水库调度 实时监测数据 数据分析模型 标签 预警规则
3
车辆自动升级方法及装置、升级时间确定模型的训练方法
时间段 升级方法 数据 车辆识别码 模型训练模块
4
跨地区的商品编码映射方法、系统、存储介质及电子设备
编码映射方法 跨地区 模型训练模块 分词 电子设备
5
基于卷积神经网络的雷达仙波点迹抑制方法
回波 训练卷积神经网络 优化网络参数 点迹特征 构建训练集
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号