摘要
本申请实施例提供了一种多模态数据处理方法、装置、电子设备及存储介质,该方法包括:对多个文本数据进行层次聚类,得到文本关系图;文本关系图包含多个文本数据各自对应的节点;针对任一节点,确定与所述节点对应的文本数据语义相同的第一文本,以及,确定与所述节点对应的文本数据语义相反的第二文本;针对任一节点对应的非文本数据,将所述非文本数据,分别与所述节点对应的各正向文本以及各第二文本进行组合,获得样本对;其中,所述节点的正向文本包括所述节点对应的文本数据以及第一文本,还包括所述节点的上级节点对应的文本数据以及第一文本。本实施例不仅获得了更多的正向文本,还获得更有针对性的第二文本,提高对比学习的效率和效果。
技术关键词
文本
节点
语义
样本
多模态
关系
聚类
电子设备
扩充模块
数据处理装置
计算机
采样模块
处理器
可读存储介质
存储器
程序
系统为您推荐了相关专利信息
车辆状态监控方法
多任务学习网络
条件概率模型
检测解码器
后验概率分布
评估系统
注意力缺陷
儿童
数据采集模块
运动协调能力
数据安全审计方法
模式识别
嵌入特征
基线
生成图谱
路径规划方法
节点
算法
均匀采样方法
路径规划装置
钛合金结构件
优化卷积神经网络
神经网络模型
灰狼算法
灰狼优化算法