文本事件抽取方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
文本事件抽取方法、装置、电子设备及存储介质
申请号:CN202411836657
申请日期:2024-12-12
公开号:CN119962525A
公开日期:2025-05-09
类型:发明专利
摘要
本发明实施例提供一种文本事件抽取方法,包括:获取原始古文文本,对原始古文文本进行预处理,确定出包括事件信息的文本片段,采用预训练的大模型和小模型对文本片段进行事件标签预测,得到第一伪标签数据,对第一伪标签数据进行标签一致性检验,得到一致性检验通过的目标伪标签数据,将目标伪标签数据作为训练集,将预设标注数据作为验证集,采用训练集和验证集对大模型和小模型进行训练,得到文本事件抽取模型,采用文本事件抽取模型对待抽取事件的古文文本进行处理,抽取古文文本的事件信息。本发明利用大模型和小模型从大量未标注的古文数据中理解古文文本的复杂信息,提高对古文文本事件抽取的准确度和效率。
技术关键词
文本 标签 事件抽取方法 训练集 基座 通信接口 模型训练模块 处理器 存储器 数据处理模块 抽取装置 电子设备 可读存储介质 分词 计算机 策略 程序 指令
系统为您推荐了相关专利信息
1
一种声纹识别测试系统及声纹识别测试方法
播放设备 发声 标签 测试方法 音箱
2
一种支持多模态生成的360度可驱动三维头像的方法
生成对抗网络 多模态 头像 面片 网格模型
3
基于属性迁移的序贯三支决策语义分类系统及方法
序贯三支决策 对象 分类系统 语义分类方法 文本情感分类
4
一种基于零知识证明的可验证生成式预训练模型的方法和装置
预训练模型 关系 零知识证明方法 线性 文本
5
一种井下高压电缆接头故障震动监测物联网系统
高压电缆接头 监测物联网系统 远程数据终端 故障特征 电缆接头故障
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号