摘要
本发明公开了一种跨模态的任务识别方法、装置、设备及介质。所述方法包括:将获取的采集图像与文本内容通过预设编码器进行特征转换与拼接,生成图像与文本的融合特征向量;根据所述融合特征向量通过预设动态更新方法将多模态聚类中心进行更新,获取新聚类中心;将所述融合特征向量与所述新聚类中心通过预设聚类算法进行特征聚类,获取聚类中心向量;将所述聚类中心向量通过预设神经网络子模型与预设门控网络生成目标任务识别结果。通过实施本发明的方法可解决现有技术无法有效将多种模态的信息进行融合的问题,从而实现高效准确的医学诊断。
技术关键词
动态更新方法
聚类算法
图像特征向量
跨模态
文本
网络
多模态
识别方法
集成学习方法
语言编码器
计算机设备
拼接单元
识别装置
处理器
存储器
介质
系统为您推荐了相关专利信息
移动终端通讯方法
识别码
通讯设备
属性识别模型
文本识别
三维虚拟场景
图形渲染模块
深度神经网络声学模型
语音识别模块
光线追踪渲染
语义分析模型
文本
历史页面
快照
Word2Vec模型