摘要
本发明公开了一种基于注意力机制的多模态可解释推荐方法,包括:1.获取产品推荐场景下的基本信息;2.提取产品文本描述的语义特征和图像区域的视觉特征;3.获取融合用户注意力后的文本、图像表征;4.利用改进后的门控循环单元(GRU)网络整合多源信息,预测用户的评论文本及其概率;5.预测用户对产品的偏好程度。本发明综合利用文本与图像的多模态数据,并引入注意力机制来识别影响用户偏好的特定视觉和文本元素,整合并赋予异质信息以不同的重视程度,进而预测用户的购买行为和评论文本,给出高效且可解释性的推荐。
技术关键词
可解释推荐方法
文本
特征提取器
语义特征
图像特征提取
视觉特征
sigmoid函数
引入注意力机制
ReLU函数
网络
双曲正切函数
门控循环单元
捕获特征
可读存储介质
正则化参数
多层感知机
系统为您推荐了相关专利信息
视觉特征提取
自动生成方法
评分机制
元素
自动生成系统
芯片电路系统
AI语音
交互系统
语音识别模块
生成音频数据