面向大规模语言模型的超长文本序列的处理方法、装置

AITNT
正文
推荐专利
面向大规模语言模型的超长文本序列的处理方法、装置
申请号:CN202410868152
申请日期:2024-07-01
公开号:CN118821730A
公开日期:2024-10-22
类型:发明专利
摘要
本申请涉及自然语言处理技术领域,公开一种面向大规模语言模型的超长文本序列的处理方法、装置。方法包括:文本序列预处理:用于对输入的超长文本序列进行预处理,包括动态序列分割与自适应序列重排,将所述超长文本序列分割成多个连续且重叠的块,并过滤掉无关噪声;构建超长文本序列处理网络:基于Transformer架构构建一个处理网络以处理经过预处理的文本序列块;分块并行处理与融合:将所述文本序列块进行分块并行处理,并将处理结果进行融合;持续学习与反馈循环:用于根据处理结果动态调整处理策略,并反馈给文本序列预处理步骤。
技术关键词
文本 序列 并行计算单元 注意力 句法结构 分块 异步通信机制 动态 网络 策略 语义结构 矩阵 词频统计 批量数据 多层感知机 关键词 程序 自然语言 噪声 指令
系统为您推荐了相关专利信息
1
基于文本的内容推荐方法、系统、智能终端及介质
文本 内容推荐方法 实体 内容推荐程序 新鲜度
2
一种用于构建模型训练数据的方法、系统、设备及介质
指标 文本分类模型 数据安全性 数据处理单元 数据处理技术
3
模型训练方法、数据处理方法以及相关设备
标识 关系 样本 特征提取模型 注意力机制
4
结合用户画像的化塑产品个性化推荐系统及方法
个性化推荐系统 标签体系 权重生成方法 构建用户画像 同义词库
5
临床试验电子病例报告表的生成方法及生成系统
生成系统 生成方法 大语言模型 数据收集模块 电子病例报告表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号