基于正则表达式的数据处理方法、系统、设备及介质

正文

推荐专利

申请号：CN202410704389

申请日期：2024-06-03

公开号：CN118550994A

公开日期：2024-08-27

类型：发明专利

摘要

本发明公开了一种基于正则表达式的数据处理方法、系统、设备及介质，该数据处理方法包括：获取原始文本数据和预先构建的正则表达式规则模型；基于特征变量对原始文本数据进行数据分割，生成按照设定顺序编号排列的文本数据队列；利用特征变量依次遍历文本数据队列进行规则匹配处理，直至将正则表达式中不再分割出新的特征变量为止，生成数据处理结果；检验数据处理结果是否含有重复文本数据，若存在，则对重复文本数据对应的特征变量进行修正以得到新的正则表达式规则模型。本发明通过修正特征变量，不断完善基于机器学习训练得到的正则表达式规则模型，解决人工编写正则表达式效率低，准确度差的问题，增强数据提取的准确性。

技术关键词

数据处理方法变量文本数据处理系统队列样本模型训练模块上存储计算机程序机器学习训练匹配模块可读存储介质处理器存储器电子设备

系统为您推荐了相关专利信息

一种结合标志位判定与体质约束机制的健康数据插补与优化方法

标志位表达式异常数据 GM模型预测健康信息管理

人工智能辅助审判方法、系统、设备、存储介质及产品

深度学习模型人工智能辅助场景软件开发工具包预处理器

一种诊断报告生成方法、装置、存储介质及电子设备

疾病诊断报告生成方法图像检测模型图像特征提取模型图像分割模型

一种AI平台下多模态问题的路由方法、介质及系统

意图识别语言声音多模态可读存储介质平台

基于RBF-NSGA-II的钢混组合桥声学优化方法

钢混组合桥声学优化结构声学变量统计能量分析

基于正则表达式的数据处理方法、系统、设备及介质

站点导航

APP 下载