摘要
本发明公开了一种基于Word2Vec模型的船舶多源数据整合方法,该方法包括以下步骤:1)收集来自不同来源的船舶备件数据;2)对收集到的船舶备件数据进行预处理;3)整理预处理后的多源船舶备件数据,结合船舶数据库标准,形成一个标准的船舶目标数据库;4)对步骤3)中提取船舶目标数据库中的备件名称信息,构建船舶备件词源,基于标准化后的船舶备件词源构建词向量模型;5)从不同来源备件数据中提取需要比对的船舶备件名称与目标数据库中备件名称进行比对,计算余弦相似度;6)对待比对备件名称和目标数据库中备件名称进行融合,最终生成统一的数据表示。本发明用词向量模型进行数据匹配与融合,能够减少人工干预,提高数据整合效率。
技术关键词
多源数据整合方法
Word2Vec模型
备件
船舶
词向量模型
编辑
关键词
文本规范化
字符
处理器
异常数据
存储装置
可读存储介质
电子设备
程序
格式
计算机
代表
系统为您推荐了相关专利信息
电混合动力系统
补偿控制方法
cRIO控制器
PID算法
永磁
六分仪
虚拟训练系统
船舶导航定位
模拟器
数学模型
船舶喷涂机器人
调平控制系统
控制回路
全景摄像头
信号采集单元