摘要
本发明公开了一种基于多视角跨模态语义对齐的多模态推荐方法及系统,涉及多模态推荐技术领域。本发明的技术要点包括:提取训练数据的用户信息、物品信息、用户‑物品交互信息和多模态辅助信息,所述多模态辅助信息包括文本模态和视觉模态;对多模态辅助信息进行处理,获取包含多模态嵌入文本表示和视觉表示的语义信息;将用户信息、物品信息、用户‑物品交互信息和语义信息输入多模态神经网络模型中进行训练;利用训练好的多模态神经网络模型进行多模态推荐。本发明解决了模态间语义鸿沟问题,通过多视角语义建模进行细粒度模态语义对齐,实验结果证明了本发明的优越性和有效性。
技术关键词
多模态辅助
文本
多视角
跨模态
语义
推荐方法
神经网络模型
视觉
编码向量
信息处理模块
推荐系统
预训练模型
模型训练模块
推荐技术
通道
注意力
度函数
有效性
系统为您推荐了相关专利信息
情感分类方法
编码模块
文本
动态滑动窗口
情感分类模型
变压器故障监测
模态特征
深度学习模型
矩阵
数据
开源框架
测试接口
待测软件
软件自动化测试方法
AI算法