摘要
本申请实施例涉及一种基于多模态的数据分类方法、系统、设备及介质,本方法通过引入跨模态语义拓扑对齐机制,生成能够表征两个图结构对应节点之间的深层语义契合度的对齐向量,进而利用对齐向量确定图像模态和文本模态对应的可信度权重,最后根据第一可信度权重与第二可信度权重,融合图像特征和文本特征,利用融合特征实现目标电子书对应的分类结果。本方法通过深度解析图像与文本的语义图结构并进行拓扑对齐,创新性地依据对齐向量动态评估模态可信度并自适应加权融合,实现了超越图像的像素和文本的词汇级别的语义理解,提升了对目标电子书进行分类的准确性。
技术关键词
嵌入特征
电子书
数据分类方法
语义
节点
多模态
融合特征
注意力
计算机可执行指令
文本特征加权
跨模态
数据分类系统
融合图像特征
可读存储介质
封面
模块
矩阵
系统为您推荐了相关专利信息
数据提取程序
数据源获取数据
关系
注意力机制
节点
气囊组件
压力
结构光投影模组
形状记忆合金驱动
支撑支架