文本任务处理方法及其模型训练方法、设备、介质、产品

正文

推荐专利

申请号：CN202411074251

申请日期：2024-08-07

公开号：CN118586448B

公开日期：2024-10-11

类型：发明专利

摘要

本发明公开了一种文本任务处理方法及其模型训练方法、设备、介质、产品，应用于人工智能技术领域。其中，方法包括获取微调文本数据集和预训练好的初始语言模型。按照多个频率基准值对各微调文本样本的位置编码信息维度进行划分，并对不同组的位置编码信息采用相匹配的插值方法进行插值处理，以得到具有处理目标长度文本数据的过渡语言模型。基于目标长度设置窗口标记长度参数值和最大允许距离参数值，并基于推理文本长度设置目标文本长度参数值，利用窗口掩码方法对过渡语言模型进行外推处理，得到文本任务处理模型。本发明可以解决相关技术由于失去对长文本全局理解的能力导致性能下降的问题，能够有效提高长文本任务的执行精度。

技术关键词

语言模型训练方法位置编码信息插值方法标记掩码方法非易失性存储介质频率因子网络结构注意力泛化方法样本训练文本数据转换器斜坡人工智能技术

系统为您推荐了相关专利信息

一种火烧迹地氮循环多因素关联分析方法

关联分析方法火烧稳定同位素质谱仪稳定同位素示踪基因

基于深度学习的岩溶地貌图像分析方法和系统

岩溶地貌地貌特征图像分析模型语义特征图像分析方法

基于大语言模型的文本协调性检测方法

文本大语言模型文件属性信息排版标识

基于时序感知量子LSTM的碳排放预测方法及应用系统

排放预测方法时序量子态注意力机制长短期记忆网络

一种基于混合遗传集成学习的风险IP识别方法

IP识别方法分类器遗传算法风险预测误差

文本任务处理方法及其模型训练方法、设备、介质、产品

站点导航

APP 下载