基于轻量化预训模型与注意力机制的长文本指令抽取方法

AITNT
正文
推荐专利
基于轻量化预训模型与注意力机制的长文本指令抽取方法
申请号:CN202511148422
申请日期:2025-08-17
公开号:CN120996043A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及一种基于轻量化预训模型与注意力机制的长文本指令抽取方法,解决了常规指令抽取模型在针对长文本进行抽取时遇到信息量大且其中信息熵程度高、碎片化严重的难题。针对于多实体多指令的长文本抽取难度系数大的情况,引入一种轻量化的预训练模型MacBERT,通过其对长文本进行编码与特征挖掘,在下游任务模型中构建多层级的抽取模型,利用其并行分析长文本中存在命名实体文本、种类,在此基础上进一步识别命名实体中的主体以及其相关的实体,最后通过实体位置的重合区域,抽取出长文本中存在的多条指令的结构体。本发明减少了重复运算所耗费的算力,提升指令模型的泛用性,同时提升对复杂长文本的抽取准确率。
技术关键词
文本 预训练模型 命名实体识别 识别命名实体 识别模块 编码特征 引入注意力机制 非线性特征 生成指令 算法模块 噪声数据 元素 网络结构
系统为您推荐了相关专利信息
1
基于导入excel与三维模型互补的变电站工程方法
多指标综合评价 造价 变电站工程 三维模型构件 人工智能模型
2
一种基于深度学习和化学领域相结合的ChemBERTa-FP抗癌药物预测方法
抗癌药物 预训练模型 细胞系 数据集构建方法 代表
3
基于大数据模型的企业需求匹配方法及系统
语义特征 需求匹配方法 交互注意力 企业 数据
4
一种基于多特征的商品视频内容评分方法及系统
线性回归模型 评分方法 商品图像识别 视频 关键特征值
5
基于图像识别的捞渣机渣量确定方法、装置及捞渣机
动态感兴趣区域 视频帧 DCS控制系统 刮板 捞渣机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号