摘要
本发明公开了一种基于跨模态对齐的舆情数据关键样本提取方法、系统、介质和产品,涉及舆情数据处理领域,包括:获取待处理舆情事件的多模态舆情数据集;利用ImageBind跨模态编码技术对多模态舆情数据集进行跨模态舆情信息对齐与编码,得到每个舆情样本的联合表示;根据每个舆情样本的联合表示,通过改进的K‑Center‑Greedy算法对多模态舆情数据集进行模态感知关键样本筛选,得到多模态舆情关键样本数据集。本发明中能够实现海量多模态舆情数据中关键样本的精准筛选,解决了多模态数据冗余、语义对齐困难及海量信息筛选效率低的问题。
技术关键词
样本提取方法
跨模态
多模态
编码技术
标签
编码器
计算机程序产品
数据冗余
语义
算法
编码模块
度量
可读存储介质
因子
处理器
索引
系统为您推荐了相关专利信息
动态预测模型
瞬态误差
瞬态特征
数据
机器学习算法
多模态特征融合
亲和力
双向长短期记忆网络
多头注意力机制
中药材活性成分