摘要
本申请提供一种多模型集成的稀缺资源信息处理方法、装置及设备。本申请的方法包括:通过第一信息抽取模型和第二信息抽取模型分别对目标文本进行信息抽取,得到两种抽取结果,将两种抽取结果分别映射到包含多个目标类别的预设字典结构,得到两种不同的映射结果;根据两种映射结果确定最终的抽取结果;第一信息抽取模型和第二信息抽取模型均是使用从样本池中筛选得到的文本样本训练得到,样本池中包括第一文本样本和根据第一文本样本扩增得到的第二文本样本,第一文本样本是按照预设数量在表示稀缺资源信息的原始文本样本中各个目标类别对应的文本样本中筛选得到的,本申请可在特定领域(数据稀少且各类别数据分布不均衡)中实现信息的准确抽取。
技术关键词
信息抽取模型
信息抽取方法
文本
样本
字典结构
大语言模型
信息处理模块
注意力机制
多模型
格结构
输入模块
跨度
误差
序列
信息处理方法
抽取装置
数据分布
处理器
编码