摘要
本发明涉及文件自动化处理技术领域,尤其涉及基于人工智能模型和RAG的文件识别处理系统,包括以下模块:文件图像预处理模块,用于接收传真件、扫描件或电子文档,并通过去噪、角度校正及二值化处理,将输入文档转换为标准化图像;文件分类模块,基于卷积神经网络对标准化图像进行特征提取并将文件自动分类为表格类或文章类;文章类预处理模块,用于将分类为文章类的文档图像进行灰度化、二值化及文本行分割。本发明中,通过卷积神经网络、Transformer OCR及大语言模型的多层AI架构,结合检索增强生成技术,实现文档从接收、预处理、分类、OCR识别、关键信息抽取到自动化路由的全流程智能化处理。
技术关键词
人工智能模型
文本行
文章
内容管理模块
表格
格式表单
消除图像噪声
识别模块
分析模块
语义
二值化算法
对比度
自动编码器
高斯滤波器
文档分类
生成文档
生成技术
系统为您推荐了相关专利信息
沉浸式交互
展示系统
生理状态监测
内容管理模块
安全监控模块
桥式起重机用
故障诊断方法
训练人工智能模型
历史运行数据
起重机故障
术前评估方法
判断系统
注意力机制
指标
人工智能模型
信用评级系统
人工智能模型
标记
规模
信息采集模块