基于大模型生成理解能力的智能文件分拣方法及装置

正文

推荐专利

申请号：CN202510960978

申请日期：2025-07-12

公开号：CN120821704A

公开日期：2025-10-21

类型：发明专利

摘要

本发明公开一种基于大模型生成理解能力的智能文件分拣方法及装置，应用于服务器。方法包括：接收文件并提取纯文本，图片文本用OCR技术提取；将纯文本与预设prompt模版拼装后发送至大模型引擎，抽取文件类型和业务关联字段生成JSON数据；基于业务关联字段在业务系统中查询，查询到则直接关联分拣文件，未查询到则暂存文件，待业务数据维护后再关联分拣。预处理含格式转换、去重和完整性校验。大模型引擎采用Transformer架构，还涉及命名实体识别、消息队列监控、交叉熵训练及混淆矩阵验证等。该方法实现文件智能分拣，提升效率和准确性，降低人工成本。

技术关键词

智能文件分拣方法命名实体识别 SimHash算法服务器 JSON格式数据队列机制文本条件随机场模型业务系统消息数学模型分拣装置字段模版标签样本注意力机制

基于大模型生成理解能力的智能文件分拣方法及装置

站点导航

APP 下载