一种用于图书出版行业的数据治理方法

正文

推荐专利

一种用于图书出版行业的数据治理方法

申请号：CN202411845781

申请日期：2024-12-16

公开号：CN119311696A

公开日期：2025-01-14

类型：发明专利

摘要

本发明提供一种用于图书出版行业的数据治理方法，涉及数据治理技术领域，解决当前图书出版行业存在数据口径不一致、数据不准确和数据重复等情况，图书数据缺乏统一数据标准的问题。方法为：对历史图书数据进行分析，依据分析得到的图书子数据建立图书子数据表；对第一图书子数据进行重复记录检测，将重复记录检测得到的重复图书子数据进行合并，根据合并后的图书子数据获得原始字段；将原始字段分别映射为对应的标准字段，并通过原始字段以及对应的标准字段建立标准字段表；将各标准字段表合并为图书数据集并输入至深度学习模型进行训练，将实时图书数据转换为标准图书数据，本发明实现对图书出版行业的数据治理，保证数据使用的标准化。

技术关键词

图书数据治理方法字段深度学习模型数据治理技术数据管理平台书籍文本标记词语号码日期符号

系统为您推荐了相关专利信息

一种宽频振荡检测及溯源方法、存储介质及处理器

溯源方法振荡特征宽频深度学习模型估计误差

一种专家推荐系统、方法、计算机设备及存储介质

专家推荐系统 BERT模型生成企业专家推荐方法分类器

一种用于髋关节置换手术的骨锤敲击力预警系统

髋关节置换手术预警模型预警系统预警模块实时信息

一种基于多源传感数据的机电设备自适应智能预警系统

智能预警系统特征提取模块传感数据采集模型数字孪生体

一种基于AIGC的甬剧演绎系统及其使用方法

演绎系统模块识别用户意图动作捕捉技术音效

一种用于图书出版行业的数据治理方法

站点导航

APP 下载