基于大语言模型的结构化信息提取方法、控制器及介质

正文

推荐专利

申请号：CN202410916931

申请日期：2024-07-09

公开号：CN118840760A

公开日期：2024-10-25

类型：发明专利

摘要

本申请涉及计算机技术领域，具体提供一种基于大语言模型的结构化信息提取方法、控制器及介质，旨在解决复杂场景下的图像结构化信息提取任务难以准确完成的问题。为此目的，本申请的方法包括：对目标图像进行版式分析，确定目标图像中的不同版面类型的至少一个分区，对每个分区中的文字进行聚类，获取每个分区的关键词信息，基于每个分区的版面类型和关键词信息调用大语言模型获取目标图像的结构化信息。如此，本申请不仅可以识别出目标图像中各个分区的版面类型，提高了提取目标图像的结构化信息的准确度，还可以对目标图像的文字进行聚类得到关键词信息，无需根据目标图像的场景定制，可以适用于多类真实场景下的存在不同版面类型的图像。

技术关键词

结构化信息提取方法大语言模型分区关键词表格图像图片光学字符识别技术聚类生成提示词自然语言位置提取表头控制器处理器场景可读存储介质多模态存储器转换器

基于大语言模型的结构化信息提取方法、控制器及介质

站点导航

APP 下载