摘要
本发明涉及一种基于先验特征嵌入的车辆数据资产识别方法,包括:在多源异构车辆业务数据的数据库中,获取资产识别的业务数据表;采用多数据项序列化方法将业务数据表进行序列化,获取表格数据序列化表示,并将该序列分词预处理,得到表格文本词向量输入;结合领域先验知识,提取业务数据表的全局统计和字符级分布两类先验特征;根据输入表格文本词向量计算段落嵌入和位置嵌入,并将它们相加以形成文本特征向量;采用多层感知机处理先验特征数据,得到数据表先验特征向量;将文本特征向量和先验特征向量拼接融合,构建融合先验知识的拼接向量并由编码层和输出层处理,输出业务数据表每一列业务数据的类型标签,实现车辆业务数据资产的分类识别。
技术关键词
资产识别方法
文本特征向量
融合先验知识
表格
多层感知机
序列化方法
统计特征
字符
分布特征
前馈神经网络
注意力机制
数据项
车辆
令牌
编码
系统为您推荐了相关专利信息
局部特征提取
动态场景
静态特征
网格特征
单目深度估计
玻璃缺陷检测方法
拉普拉斯金字塔
高斯金字塔
图像
强化学习算法
恶意软件分类方法
集成策略
机器学习模型
词袋模型
安卓恶意软件
辅助设计方法
规划机器人
故障诊断机器人
文档解析技术
开关电源器件
分布预测方法
异构
多层感知机
土地利用数据
交叉验证方法