面向大规模语言模型的超长文本序列的处理方法、装置

正文

推荐专利

申请号：CN202410868152

申请日期：2024-07-01

公开号：CN118821730A

公开日期：2024-10-22

类型：发明专利

摘要

本申请涉及自然语言处理技术领域，公开一种面向大规模语言模型的超长文本序列的处理方法、装置。方法包括：文本序列预处理：用于对输入的超长文本序列进行预处理，包括动态序列分割与自适应序列重排，将所述超长文本序列分割成多个连续且重叠的块，并过滤掉无关噪声；构建超长文本序列处理网络：基于Transformer架构构建一个处理网络以处理经过预处理的文本序列块；分块并行处理与融合：将所述文本序列块进行分块并行处理，并将处理结果进行融合；持续学习与反馈循环：用于根据处理结果动态调整处理策略，并反馈给文本序列预处理步骤。

技术关键词

文本序列并行计算单元注意力句法结构分块异步通信机制动态网络策略语义结构矩阵词频统计批量数据多层感知机关键词程序自然语言噪声指令

系统为您推荐了相关专利信息

基于文本的内容推荐方法、系统、智能终端及介质

文本内容推荐方法实体内容推荐程序新鲜度

一种用于构建模型训练数据的方法、系统、设备及介质

指标文本分类模型数据安全性数据处理单元数据处理技术

模型训练方法、数据处理方法以及相关设备

标识关系样本特征提取模型注意力机制

结合用户画像的化塑产品个性化推荐系统及方法

个性化推荐系统标签体系权重生成方法构建用户画像同义词库

临床试验电子病例报告表的生成方法及生成系统

生成系统生成方法大语言模型数据收集模块电子病例报告表

面向大规模语言模型的超长文本序列的处理方法、装置

站点导航

APP 下载