摘要
本发明涉及知识迁移与消息空间采样的多语言社交媒体事件检测方法,属自然语言处理领域。本发明包括:利用预训练语言模型词嵌入方法对打乱的中文、英文、越南语社交媒体消息进行编码,利用随机游走完善粗略的多语言社交媒体消息图中缺失的关系连接,得到异构多语言社交媒体消息图,再将异构多语言社交媒体消息图转换为同构多语言社交媒体消息图;利用基于角度约束的成对损失采样策略对同构多语言社交媒体消息图进行GNN图神经网络训练并采用改进的成对损失进行正负样本采样,进行聚类训练,得到聚类结果。本发明通过将多语言信息作为指导信息融入实现多语言社交媒体消息聚类,从获取到的多语言社交消息网络数据中得到聚类信息。
技术关键词
事件检测方法
消息
社交
媒体
多语言
样本
节点
预训练语言模型
维基百科
邻居
词嵌入方法
粗略
神经网络训练
矩阵
聚类
语义
非暂态计算机可读存储介质
事件检测系统
异构
编码器
系统为您推荐了相关专利信息
展品信息
导游机器人
定位桩
信号发射装置
智能导游
数值型指标
需求预测方法
新能源汽车
融合特征
情感特征