一种面向国家数据标准文件智能提取数据元的方法及系统

AITNT
正文
推荐专利
一种面向国家数据标准文件智能提取数据元的方法及系统
申请号:CN202510488705
申请日期:2025-04-18
公开号:CN120336507A
公开日期:2025-07-18
类型:发明专利
摘要
本发明涉及人工智能大模型应用技术领域,具体为一种面向国家数据标准文件智能提取数据元的方法及系统,包括以下步骤:读取数据标准文档内容,将读取的文档内容按照预设规则进行文本分块,编写大模型Prompt,编写大模型Prompt,将数据元和正则表达式提取结果持久化存储到数据库中;有益效果为:通过调试大模型prompt对国家标准文件进行深度语义解析,利用文本分段与自然语言处理技术相结合的手段,实现对文件中数据元的精准识别与提取。本发明能够快速、准确地从国家数据标准文件中获取关键数据信息,并将提取的数据元、数据规则信息数据结构标准化,可直接用于后续的数据建模、数据质检,极大地节省了人力和时间成本。
技术关键词
文本 分块 OCR文字识别 数据库表结构 国家标准文件 表格 信息数据结构 图片 识别模块 存储模块 自然语言 列表 定义 接口 语义 分段 人力
系统为您推荐了相关专利信息
1
基于大语言模型多智能体协作的自动渗透测试方法及装置
大语言模型 多智能体协作 渗透测试方法 渗透测试工具 渗透测试装置
2
图像生成方法、装置、设备、计算机可读存储介质及产品
大语言模型 媒体 文本 图像模板 图像生成方法
3
提示音频的生成方法、装置、设备、介质
自然语言模型 情感反馈 深度学习模型 语音 车载终端
4
一种基于知识增强的文本纠错方法
文本纠错方法 语句 答案 问答模型 文本纠错系统
5
一种基于并行可变窗口卷积神经网络的数据配准方法
数据配准方法 卷积模块 卷积神经网络结构 三元组损失函数 并行数据处理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号