摘要
本发明公开了一种电网领域关键词抽取方法、训练方法、介质和设备,在训练阶段先获取电网领域词典并构建电网领域伪数据集,再将伪数据集输入预训练语言模型,进行初步调整,获得调整后的电网领域预训练模型。接着获取电网领域的第一文本数据集,对其进行预处理,得到目标文本数据集,最后将目标文本数据集输入调整后的预训练模型,进行二次调整,获得最终的电网领域关键词抽取模型。在应用阶段,将待抽取数据集输入训练好的电网领域关键词抽取模型,获取目标标签序列,并基于目标标签序列从待抽取数据集中抽取电网领域关键词,得到关键词列表。本发明提供了一种高效、精准的电网领域关键词抽取解决方案。
技术关键词
预训练语言模型
预训练模型
标签预测值
文本
关键词抽取方法
数据
字符
条件随机场
词典
卷积神经网络提取
长短记忆网络
序列
融合特征
处理器
术语
可读存储介质
终端设备
列表
系统为您推荐了相关专利信息
动作定位方法
多模态
大语言模型
动作定位系统
阶段
多任务
策略网络模型
多智能体系统
状态编码器
深度强化学习
视频
多模态特征
电子设备本体
大语言模型
自定义标签