摘要
本发明实施例提供一种文本事件抽取方法,包括:获取原始古文文本,对原始古文文本进行预处理,确定出包括事件信息的文本片段,采用预训练的大模型和小模型对文本片段进行事件标签预测,得到第一伪标签数据,对第一伪标签数据进行标签一致性检验,得到一致性检验通过的目标伪标签数据,将目标伪标签数据作为训练集,将预设标注数据作为验证集,采用训练集和验证集对大模型和小模型进行训练,得到文本事件抽取模型,采用文本事件抽取模型对待抽取事件的古文文本进行处理,抽取古文文本的事件信息。本发明利用大模型和小模型从大量未标注的古文数据中理解古文文本的复杂信息,提高对古文文本事件抽取的准确度和效率。
技术关键词
文本
标签
事件抽取方法
训练集
基座
通信接口
模型训练模块
处理器
存储器
数据处理模块
抽取装置
电子设备
可读存储介质
分词
计算机
策略
程序
指令
系统为您推荐了相关专利信息
序贯三支决策
对象
分类系统
语义分类方法
文本情感分类
高压电缆接头
监测物联网系统
远程数据终端
故障特征
电缆接头故障