基于轻量化预训模型与注意力机制的长文本指令抽取方法

正文

推荐专利

申请号：CN202511148422

申请日期：2025-08-17

公开号：CN120996043A

公开日期：2025-11-21

类型：发明专利

摘要

本发明涉及一种基于轻量化预训模型与注意力机制的长文本指令抽取方法，解决了常规指令抽取模型在针对长文本进行抽取时遇到信息量大且其中信息熵程度高、碎片化严重的难题。针对于多实体多指令的长文本抽取难度系数大的情况，引入一种轻量化的预训练模型MacBERT，通过其对长文本进行编码与特征挖掘，在下游任务模型中构建多层级的抽取模型，利用其并行分析长文本中存在命名实体文本、种类，在此基础上进一步识别命名实体中的主体以及其相关的实体，最后通过实体位置的重合区域，抽取出长文本中存在的多条指令的结构体。本发明减少了重复运算所耗费的算力，提升指令模型的泛用性，同时提升对复杂长文本的抽取准确率。

技术关键词

文本预训练模型命名实体识别识别命名实体识别模块编码特征引入注意力机制非线性特征生成指令算法模块噪声数据元素网络结构

系统为您推荐了相关专利信息

基于导入excel与三维模型互补的变电站工程方法

多指标综合评价造价变电站工程三维模型构件人工智能模型

一种基于深度学习和化学领域相结合的ChemBERTa-FP抗癌药物预测方法

抗癌药物预训练模型细胞系数据集构建方法代表

基于大数据模型的企业需求匹配方法及系统

语义特征需求匹配方法交互注意力企业数据

一种基于多特征的商品视频内容评分方法及系统

线性回归模型评分方法商品图像识别视频关键特征值

基于图像识别的捞渣机渣量确定方法、装置及捞渣机

动态感兴趣区域视频帧 DCS控制系统刮板捞渣机

基于轻量化预训模型与注意力机制的长文本指令抽取方法

站点导航

APP 下载