摘要
本发明提供了一种基于大模型的线下资料数字化方法、系统及存储介质,该方法包括:对待数字化线下资料进行文本识别,得到线下文档;将内容抽取需求与线下文档进行组合,得到资料数字化提示;将资料数字化提示输入预训练后的大模型进行内容抽取,得到资料抽取数据,对资料抽取数据进行数据校验;将数据校验后的资料抽取数据填充至线上资料模板中。本发明实施例,通过对待数字化线下资料进行文本识别,使得无需采用人工的方式进行文本的复制和粘贴,通过将资料数字化提示输入预训练后的大模型进行内容抽取,以基于大模型强大的推理能力对线下文档进行内容的自动抽取,无需采用人工的方式进行内容抽取,提高了下资料数字化效率。
技术关键词
资料
数字化方法
线下
文本识别
特征金字塔
卷积特征
数据
模板
样本
标识符
可读存储介质
语义
实体
图像
对象
模块
计算机
处理器
参数