摘要
本发明提供一种基于思维链和排名学习的多任务信息抽取方法及装置,属于数据处理技术领域,所述方法包括:基于信息抽取任务需求,确定多个约束条件;将指令、思维链示例与目标文本进行拼接,作为输入数据;基于输入数据,对目标模型进行标准微调,得到微调目标模型;在微调目标模型上,以预设温度进行推理采样,生成中间数据集后,基于中间数据集,确定新的训练数据集;在新的训练数据集上,基于多个约束条件进行排名学习,得到优化目标模型;使用不同的预设温度进行推理采样,迭代训练优化目标模型,得到信息抽取模型;将待提取信息输入至信息抽取模型,得到信息抽取模型输出的信息提取结果。本发明降低了对标注数据的依赖,实现可控的优化。
技术关键词
信息抽取方法
信息抽取模型
多任务
实体
非暂态计算机可读存储介质
风格
标签
关系
处理器
文本
数据处理技术
语法结构
抽取装置
计算机程序产品
评价器
采样模块
指令
存储器
系统为您推荐了相关专利信息
可视化检索方法
图片
信息智能检索系统
命名实体识别
关键特征点
资产数字化方法
实体
多模态信息
传感器
数据嵌入
蜂窝夹层结构板
特征提取方法
三维模型
结构件
颜色校正