一种司法数据卷宗生成方法、系统及计算机程序产品

正文

推荐专利

申请号：CN202411496890

申请日期：2024-10-24

公开号：CN119397474A

公开日期：2025-02-07

类型：发明专利

摘要

本申请公开了一种司法数据卷宗生成方法、系统及计算机程序产品，通过获取电子卷宗图像数据和音频数据；将电子卷宗图像数据进行预处理；采用OCR技术识别预处理后的电子卷宗图像数据，得到第一文本数据；采用语言识别技术识别音频数据，得到第二文本数据；将第一文本数据和第二文本数据进行融合，得到融合数据；利用预先训练好的大语言模型分析融合数据，并提取融合数据的关键信息；根据关键信息对融合数据进行分类，并为每份融合数据分配相应的标签，得到结构化存储的司法数据卷宗。本申请提供的一种司法数据卷宗生成方法、系统及计算机程序产品克服了传统的正则表达式和NLP技术存在的局限性，提高了司法卷宗结构化的准确性和效率。

技术关键词

生成方法图像内容分类语言识别技术法律知识图谱计算机程序产品文本音频电子跨模态学习深度学习算法识别模块图像处理技术数据获取模块生成系统案件数据分类动态更新标签

一种司法数据卷宗生成方法、系统及计算机程序产品

站点导航

APP 下载