摘要
本公开提供了一种数据打标方法。可以应用于大数据技术领域和人工智能技术领域。该方法包括:获取多个多模态数据,对所述多个多模态数据进行预处理,生成多个预处理后的文本数据。对所述多个预处理后的文本数据进行向量转化,生成多个特征向量数据。对所述多个特征向量数据进行密度聚类,生成a个数据集,其中,每个数据集包括一个第一数据标签。通过语义分析对a个第一数据标签进行语义聚类,生成b个第二数据标签。以及预设业务知识图谱,对所述业务知识图谱与所述b个第二数据标签进行知识融合,生成b个目标数据标签,用以进行数据打标。本公开还提供了一种数据打标装置、设备、存储介质和程序产品。
技术关键词
数据标签
数据打标方法
多模态
语义
文本
图谱
聚类
层级
打标装置
跨模态
关联规则算法
分块
人工智能技术
密度
计算机程序产品
处理器
模块
可读存储介质
电子设备
系统为您推荐了相关专利信息
节点
语义信息提取
结构优化方法
异构
结构优化系统
主动安全控制方法
作业风险
多参数
控制策略
主动安全控制装置
风力涡轮机状态
机器学习模型
叶片
光缆
分布式光纤传感
时域统计特征
多模态
机器人故障诊断
Softmax函数
模态特征