摘要
本申请公开了一种多模态信息融合的站点识别方法及装置,涉及计算机技术领域,该方法包括:获取待识别网站的图像以及文本;通过图像特征提取模型对图像进行图像特征提取,以得到待识别网站的视觉特征;通过第一多头注意力层捕捉视觉特征的特征关系,以得到视觉自注意力权重矩阵;通过文本特征提取模型对文本进行文本特征提取,以得到待识别网站的文本特征;通过第二多头注意力层捕捉文本特征的特征关系,以得到文本自注意力权重矩阵;将视觉多头注意力权重矩阵以及文本字自注意力权重矩阵转换为融合特征;通过全连接层对基于融合特征输出待识别网站的识别结果;从而提高了赌博网站的识别效率。
技术关键词
注意力
图像特征提取模型
文本
多模态信息融合
语义理解模型
融合特征
视觉特征
矩阵
识别方法
图像增强
深度残差网络
站点
分类准确率
线性
特征提取模块
关系
系统为您推荐了相关专利信息
产品包装
风格
深度卷积神经网络
指数衰减函数
语义特征
智能背景墙
强化学习模型
视频生成技术
意图识别模型
预训练模型
信息识别方法
注意力机制
自然语言
命名实体识别模型
行业术语