摘要
本发明涉及合同管理技术领域,公开了一种基于ocr,nlp及正则表达式的合同文件文字内容提取方法,包括以下步骤:S1、采用深度学习框架构建OCR文字识别模型及NLP关键字提取模型,并对模型进行训练;S2、将训练后的模型部署在容器中,提供接口供业务系统调用;S3、业务系统接收客户上传的合同文件,使用OCR文字识别模型进行文本检测和识别,提取合同文本内容;使用NLP关键字提取模型进行信息抽取,提取关键词和结构化信息;S4、使用正则表达式对合同文件识别结果与订单合同信息进行匹配;S5、找出不匹配的部分并进行标记;以解决现有技术无法高效、准确地识别和处理非标准化贸易合同文件的审核工作的技术问题。
技术关键词
内容提取方法
OCR文字识别
关键字
深度学习框架
业务系统
合同管理技术
文本识别
订单
非标准化
关键词
样本
标记
算法
客户
模块
数据
策略
容器
贸易
系统为您推荐了相关专利信息
业务受理系统
双声道
后台服务器
评价装置
评价方法
蛋白质二级结构
分析方法
数据
结构分析技术
随机噪声
多层结构
信令分析方法
文本
生成数据库
大语言模型
深度学习模型
深度学习框架
电力
物资需求预测
特征选择