摘要
本发明涉及一种基于数据融合驱动的政务知识图谱构建方法,首先,提出了政务领域原始数据预处理框架,研究了面向政务便民服务的多模态数据融合模型,提出政务领域原始数据映射规则和属性融合规则,利用ViT模型进行部分政务数据视觉模态的特征提取,实现多模态数据对齐,获得规范化高质量多模态政务领域数据。然后,基于政务便民服务场景和规范化高质量多模态政务领域数据特征设计了政务领域本体模型,采用protégé实现政务领域本体构建与存储。最后,设计数据映射规则,采用图数据库Neo4j实现多模态政务知识图谱的构建与存储。多模态政务知识图谱的构建,有效整合了多模态、半结构化的政务领域原始数据,为政务便民服务提供重要的知识库支撑。
技术关键词
政务
知识图谱构建方法
实体
半结构化文本数据
特征量化方法
便民服务信息
融合规则
多模态数据融合
图像
视觉特征提取
数据冗余
模态特征
场景
分词
脚本