摘要
本发明公开了一种基于大模型事件聚焦与术语增强的通信故障事件论元抽取方法,包括:首先,对大语言模型进行微调,以提取通信故障文档中的事件信息和专业术语信息;其次,构建事件边界感知的编码模块,通过非自回归编码方式对嵌入事件信息的提示模板进行编码,增强对事件边界的区分能力;接着,构建语义增强的专业术语识别模块,利用双层注意力机制将专业术语信息与文本特征进行层次化交互,提升术语识别的准确性;最后,基于编码后的文本特征和术语识别结果,采用注意力聚焦机制抽取事件论元。本方法在通信故障数据集和电信通信故障数据集上均取得了显著的性能提升,有效解决了多事件文本边界难以区分和专业术语识别困难的问题。
技术关键词
论元抽取方法
联合损失函数
文本
术语
识别模块
多头注意力机制
编码模块
更新模型参数
条件随机场
语义
模板特征
计算机装置
大语言模型
编码特征
标签
系统为您推荐了相关专利信息
代码特征
抽象语法树
大语言模型
神经网络模型
计算机设备
环境健康风险评估
矿渣堆场
受体
重金属复合污染
金属冶炼厂
文本
实体抽取技术
车牌号识别方法
字符识别
构建训练集