摘要
本发明公开了一种生成式信息抽取方法及系统,方法包括:获取不同的信息抽取指令,将所述信息抽取指令传递给大语言模型,得到信息抽取任务指令集合;获取原始数据集,利用大语言模型处理所述原始数据集中样例的输入,得到候选样例集合;对所述候选样例集合中样例的文本质量和原始数据集中样例输入的相似度进行打分,得到样例输入;利用第一噪声过滤法将所述样例输入中的噪声样例进行过滤,得到第一样例,并将所述第一样例的结构化文本数据进行转换,得到第二样例;将所述第二样例结合所述信息抽取任务指令集合对所述大语言模型进行调整,得到调整后的大语言模型,以实现信息抽取。在不同领域和任务中表现出良好的适应性。
技术关键词
信息抽取方法
大语言模型
计算机可执行指令
过滤法
单词匹配方法
噪声
指令生成方法
文本规范化
处理器
数据
过滤模块
模板
可读存储介质
存储器
电子设备
格式