摘要
本申请公开了一种模型训练方法、数据处理方法、系统及存储介质,涉及大模型技术、数据处理领域。其中,该方法包括:采用上游任务数据对初始语言模型进行预训练,得到预训练模型;基于目标提示与目标训练文本对预训练模型进行模型微调,得到目标语言模型;其中,目标提示用于按照预定义模型输出的结构化格式引导预训练模型执行信息抽取任务,目标训练文本由多模态训练数据转换得到,目标语言模型用于对多模态应用数据进行信息抽取以得到目标抽取结果。本申请解决了相关技术在处理文档抽取任务时存在的信息抽取效率低、准确性差的技术问题。
技术关键词
模型训练方法
数据处理方法
预训练模型
多模态
应用程序编程接口
操作界面
文本
格式
字段
对象
可读存储介质
定义
光学字符识别
智能文档
图形用户界面
客户端
数据处理系统
计算机程序产品
系统为您推荐了相关专利信息
多模态数据采集
帕金森
多模态传感器
震颤
数据采集单元
智能售货机
远程管理平台
远程管理系统
可移动货架
社交媒体平台
模型训练方法
主机
非暂态计算机可读存储介质
参数
电子设备