证件抽取大模型的强化学习方法、装置、设备及可读介质

正文

推荐专利

申请号：CN202510501687

申请日期：2025-04-21

公开号：CN120354970A

公开日期：2025-07-22

类型：发明专利

摘要

本公开是关于一种证件抽取大模型的强化学习方法、装置、设备及可读介质，涉及计算机技术领域。该方法在强化学习中可以基于样本证件图像与待抽取字段构建抽取指令并输入策略模型，以获取策略模型输出的文本抽取结果，一张样本证件图像对应一组多个文本抽取结果，每个文本抽取结果包括所有待抽取字段的一种字段内容；采用基于待抽取字段的约束条件构建的奖励函数确定文本抽取结果的奖励值，并根据奖励值确定每个文本抽取结果在组内的相对优势，并基于该相对优势对策略模型进行参数更新获得证件抽取大模型。该方法在无标注样本证件图像上进行强化学习省略了标注成本，获得的证件抽取大模型既实现了端到端的高效识别，且训练方法简单降低资源消耗。

技术关键词

证件图像强化学习方法文本策略字段样本指令学习装置处理器模型更新参数模块可读存储介质计算机电子设备格式存储器资源

证件抽取大模型的强化学习方法、装置、设备及可读介质

站点导航

APP 下载