一种基于ocr,nlp及正则表达式的合同文件文字内容提取方法

AITNT
正文
推荐专利
一种基于ocr,nlp及正则表达式的合同文件文字内容提取方法
申请号:CN202411970819
申请日期:2024-12-30
公开号:CN119888754A
公开日期:2025-04-25
类型:发明专利
摘要
本发明涉及合同管理技术领域,公开了一种基于ocr,nlp及正则表达式的合同文件文字内容提取方法,包括以下步骤:S1、采用深度学习框架构建OCR文字识别模型及NLP关键字提取模型,并对模型进行训练;S2、将训练后的模型部署在容器中,提供接口供业务系统调用;S3、业务系统接收客户上传的合同文件,使用OCR文字识别模型进行文本检测和识别,提取合同文本内容;使用NLP关键字提取模型进行信息抽取,提取关键词和结构化信息;S4、使用正则表达式对合同文件识别结果与订单合同信息进行匹配;S5、找出不匹配的部分并进行标记;以解决现有技术无法高效、准确地识别和处理非标准化贸易合同文件的审核工作的技术问题。
技术关键词
内容提取方法 OCR文字识别 关键字 深度学习框架 业务系统 合同管理技术 文本识别 订单 非标准化 关键词 样本 标记 算法 客户 模块 数据 策略 容器 贸易
系统为您推荐了相关专利信息
1
政务服务跨平台的办事过程无感评价方法及装置
业务受理系统 双声道 后台服务器 评价装置 评价方法
2
一种基于光谱和卷积神经网络结合的蛋白质二级结构分析方法
蛋白质二级结构 分析方法 数据 结构分析技术 随机噪声
3
信令分析方法、系统、电子设备及存储介质
多层结构 信令分析方法 文本 生成数据库 大语言模型
4
数据迁移方法、装置、计算机设备及存储介质
数据迁移方法 语句 策略 格式化 计算机设备
5
一种电力物资需求预测方法、系统、设备及介质
深度学习模型 深度学习框架 电力 物资需求预测 特征选择
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号