摘要
一种基于关系型的面向大规模多模数据的数据导入方法,属于计算机技术领域;获取原始数据文件、存储格式和数据模型;通过数据转换模块对进行解析、读取并结构化获取原始数据文件数据信息;通过分块并行写入方法将数据信息生成统一关系数据模型文件,并存储为同一文件存储格式CSV;通过数据关联模块进行预处理;提取模式信息,将模式信息发送给模式转换模块,模式转换模块自动生成关系表并建立DDL语句;将DDL语句和CSV文件发送至SQL处理终端,通过数据库的COPY语句和DDL语句将多模数据统一转换为关系数据,并存储到关系数据库的底层存储结构中。本发明将多模数据统一存储在同一存储层中,使查询能直接从数据库存储层调用,加快了数据转换效率。
技术关键词
数据导入方法
文件存储格式
关系数据模型
数据转换模块
子模块
自定义函数
语句
生成规则
生成关系
索引
字段
模式
文件获取方法
嵌套结构
存储结构
数据库管理系统
分布式文件系统
生成数据块
文件扩展名
系统为您推荐了相关专利信息
组队系统
子模块
组队方法
画像数据库
大语言模型
可视化手术
导航系统
结构相似性算法
图像校正
子模块