摘要
公开了使用生成式AI来补充自动信息提取。计算机视觉(CV)和/或光学字符识别(OCR)模型和生成式人工智能(AI)模型被一起用于从源提取信息(例如,姓名、日期、发票号码等)。可以使用(多个)接受阈值来接受针对来自模型的提取的数据元素的预测,并且来自生成式AI模型的预测可以是优选的,或者人工可以负责审查元素。如果没有模型满足其相应接受阈值(无论是通用还是特定于该模型的),则可以标记这些(多个)元素以用于后续人工审查,或者人工可以被循环使用以校正这些(多个)元素。然后可以使用这些标记的元素对模型进行重新训练。
技术关键词
CV模型
RPA机器人
元素
计算机程序指令
人工智能AI模型
变分自动编码器
光学字符识别
数据
超文本标记语言
生成对抗网络
计算机视觉
存储计算机程序
处理器
变换器
标识
系统为您推荐了相关专利信息
数据格式转换装置
因子
数据存储器
数据输出模块
数据输入模块
黑皮鸡枞菌
数据集扩充方法
孔洞
对象
计算机可读指令
LSTM神经网络
轨道
识别方法
神经网络训练
数据