摘要
本发明公开了一种化工造价数据清洗方法及系统,该方法包括:S1.将化工领域多个专业的异构数据源集合并形成多模态数据库,S2.对所述多模态数据库中的非结构化数据和实时流数据转换为结构化数据,S3.提取S2中多模态数据库的术语,构建动态更新的跨专业术语映射库;S4.对跨专业术语映射库中的术语进行智能清洗并输出标准化术语库;S5.对标准化术语库采用双重验证机制提升识别准确率。本发明提供的化工造价数据清洗方法及系统,构建了多模态数据库,通过融合领域知识图谱与深度学习模型,实现跨专业术语的精准对齐与动态更新,并生成标准化数据库,有效解决了化工造价数据“多源异构、语义割裂”的行业难题,为智能造价分析提供高质量数据基础。
技术关键词
数据清洗方法
术语
多模态数据库
双重验证机制
造价
动态更新
数据清洗系统
工程量清单
图谱
化工工艺流程
生成优化建议
迁移学习模型
交互式界面
权限管理模块
异构
区块链存证
深度学习模型
特征提取模块
系统为您推荐了相关专利信息
智能分析引擎
医药
多模态数据库
关联规则挖掘方法
多模态影像数据
文本
清洗方法
非暂态计算机可读存储介质
格式
语义角色标注