摘要
一种基于大模型的电力设备知识抽取方法、系统、设备及介质,方法包括将输入原始文本使用专业标注的实体识别模型,采用数据增强的方法进行实体识别;对实体识别结果进行格式转换,并构建映射集使替换的格式映射到原实体名称,使实体识别结果的输出格式转换为包含占位符的文本和对应的实体映射表;对实体识别结果通过大模型来纠正错误标注结果;基于输出格式转换及错误标注结果纠正之后的实体识别结果,设计用于关系抽取的大模型系统提示词,并通过输入待处理的文本,获取大模型输出结果;对大模型输出结果进行检查,筛选出符合要求的结果,完成电力设备知识抽取。本发明融合了大模型的复杂语义理解能力与轻量化实体识别模型的专业性优势。
技术关键词
知识抽取方法
实体识别模型
电力设备
抽取系统
文本
格式
预训练模型
纠正错误
专业
掩码策略
条件随机场
识别模块
纠错模块
语句
关系
字符
数据
语义
系统为您推荐了相关专利信息
多模态特征
数据
患者
影像纹理特征
影像分析技术