摘要
本发明公开了一种多模态多任务的论坛用户跨站关联方法及系统,该方法包括:从论坛中抓取帖子内容,并对文本、图片、时间、上下文等信息进行整合;将结构化数据转化为多模态嵌入向量;将多模态嵌入向量组合成一个综合的用户特征向量;将用户特征向量组织成集合并训练多任务学习模型,得到识别模型。该系统包括:整合单元、编码单元、内容关联单元和训练模块。本发明实现了跨平台的匿名用户的多账号关联,能够识别出不同论坛帖子背后的同一作者或用户。本发明可广泛应用于用户身份识别领域。
技术关键词
论坛
帖子
多模态
多任务学习模型
文本
图片
词嵌入向量
数据
生成随机
编码
异构
处理器
标记
节点
语义
标签
注意力
序列
话题
系统为您推荐了相关专利信息
兴趣标签生成方法
量子纠缠态
稀疏特征选择
矩阵
多模态
多任务学习模型
联合损失函数
知识图谱补全
实体
双向长短期记忆网络