一种多模型集成的稀缺资源信息抽取方法、装置及设备

正文

推荐专利

申请号：CN202510924819

申请日期：2025-07-04

公开号：CN120951947A

公开日期：2025-11-14

类型：发明专利

摘要

本申请提供一种多模型集成的稀缺资源信息处理方法、装置及设备。本申请的方法包括：通过第一信息抽取模型和第二信息抽取模型分别对目标文本进行信息抽取，得到两种抽取结果，将两种抽取结果分别映射到包含多个目标类别的预设字典结构，得到两种不同的映射结果；根据两种映射结果确定最终的抽取结果；第一信息抽取模型和第二信息抽取模型均是使用从样本池中筛选得到的文本样本训练得到，样本池中包括第一文本样本和根据第一文本样本扩增得到的第二文本样本，第一文本样本是按照预设数量在表示稀缺资源信息的原始文本样本中各个目标类别对应的文本样本中筛选得到的，本申请可在特定领域（数据稀少且各类别数据分布不均衡）中实现信息的准确抽取。

技术关键词

信息抽取模型信息抽取方法文本样本字典结构大语言模型信息处理模块注意力机制多模型格结构输入模块跨度误差序列信息处理方法抽取装置数据分布处理器编码

一种多模型集成的稀缺资源信息抽取方法、装置及设备

站点导航

APP 下载