摘要
本发明涉及非结构化数据管理技术领域,具体公开了一种非结构化数据建模方法及系统,所述方法包括基于LDA模型对样本文本数据进行主题识别,同步统计各个主题的词语分布,得到含有概率项的主题库以及每个主题对应的含有概率项的词语库;接收用户上传的待处理数据,按顺序对缓存库中的数据进行格式识别,保留图像数据,并将其他数据转换为待处理文本数据;基于含有概率项的主题库以及每个主题对应的含有概率项的词语库将待处理文本数据转换为图像数据,统计图像数据,作为留存数据;本发明借助现有的图像生成模型,比如AI图像生成软件,将文本数据转换为图像数据,进行留存,转换后的数据的直观性极佳。
技术关键词
主题
文本
数据建模方法
词语
LDA模型
样本
数据建模系统
图像生成模型
数据标签
音频
端口
格式
数据获取模块
视频
图像转换模块
数据缓存单元
数据管理技术
特征提取单元
系统为您推荐了相关专利信息
骨架识别
骨架动作识别方法
骨架特征
文本
多模态
智能评估系统
智能评估方法
查询关键词
命名实体识别技术
字符
实体识别模型
三元组
知识图谱构建方法
深度学习模型
结构化数据格式
风险识别模型
风险判定方法
场景
拆分规则
分类模型识别