摘要
本发明涉及计算机信息技术领域,具体涉及一种基于人工智能的文件管理系统及方法,系统包括:本体构建模块,用于构建财务和用户档案领域的本体结构,为文档和用户信息提供语义表示框架;文档分类与信息提取模块,用于利用卷积神经网络和光学字符识别技术对输入文档进行图像分类,并基于文档类别选择对应的信息提取模板,以提取文档的关键字段信息;文档结构和用户画像建模模块,用于将关键字段信息转换为文档结构化数据和用户画像数据,并以JSON格式表示;RDF映射模块,用于将JSON格式的数据按照本体结构的语义关系映射为资源描述框架三元组数据;推理引擎模块,用于使用SHACL规则对三元组数据进行语义推理和数据校验,以判断文档和用户数据是否符合财务法规要求,并推断生成对应的用户画像分类结果和文档标签;数据交互机制,用于基于消息队列实现数据异步传输。本发明可以实现对财务与行政文档的自动处理、结构化建模、合规性验证与用户画像分类,提升文档管理的自动化水平与智能化能力。
技术关键词
文件管理系统
数据交互机制
三元组
画像
光学字符识别技术
信息提取模板
卷积神经网络分类
关键字
文档分类
财务
语义
模块
格式
消息队列系统
计算机信息技术
文件管理方法
文档关键词
框架
系统为您推荐了相关专利信息
大语言模型
标签
样本
生成用户画像
强化学习算法
智能诊断方法
储能电站
智能告警
电池单体
更新知识图谱
车辆运行数据
画像
方向盘转向角度
车辆运行状态
监督学习模型
人脸检测方法
空域特征
融合特征
频域特征
三元组损失函数