摘要
本发明公开了一种基于胶囊网络的科学数据资产多标签文本分类方法,该方法首先对学术论文数据集进行预处理得到文本数据。其次对于文本数据,通过多级层次胶囊网络模型M‑CapsNet的混合特征模块tAL‑HPYP,进行特征提取和融合。然后将融合后的特征传递到多级层次胶囊网络模型的主干网络M‑Capsj模块,输出分类预测向量传递到子解码器网络中,同时利用改进的铰链损失动态调整全局损失。最后将各子解码器网络的分类结果连接到最终的解码器网络,汇总所有输出标签得到最终预测分类的多标签。本发明能够从科学数据文本中提取深层次、多维度的多标签特征,提升多标签文本分类任务的效果。
技术关键词
胶囊网络模型
主题
融合策略
解码器
资产
数据
多标签文本分类
sigmoid函数
语义特征提取
节点
摘要
前馈神经网络
编码器
重构
系统为您推荐了相关专利信息
甲状腺癌患者
基因表达数据
多模态深度学习
免疫细胞
多任务学习模型
多模态数据融合
多模态特征
回归预测模型
融合策略
注意力机制
滚珠丝杠驱动
注意力机制
缺陷检测方法
特征提取网络
多尺度特征
解码器
图像分割方法
医学图像分割模型
适配器
编码器