基于模态语义空间对齐的学习视频推荐方法、介质、设备

正文

推荐专利

申请号：CN202510878773

申请日期：2025-06-27

公开号：CN120372045B

公开日期：2025-08-26

类型：发明专利

摘要

本发明提出基于模态语义空间对齐的学习视频推荐方法、介质、设备，涉及多模态语义空间对齐技术领域，方法包括：提取用户行为向量、学习视频不同模态的向量，包括：文本、图像、音频以及结构向量；利用多层感知机将提取到的不同模态的向量投影到公共语义空间，在公共语义空间内，将结构向量分别与文本向量、图像向量以及音频向量进行向量拼接；将拼接后的向量进行模态对比和模态匹配，通过优化不同模态之间的语义对齐，得到学习视频的多模态特征向量；将多模态特征向量进行融合，通过余弦相似度计算用户行为向量与融合多模态特征向量的相似性，并对所有视频进行排序推荐。本发明可以充分理解学习视频的模态语义结构，实现精准匹配和推荐。

技术关键词

视频推荐方法语义音频节点多层感知机图像知识点计算机可读指令生成结构多模态标签关系文本特征向量邻居 BERT模型 RNN模型特征提取方法注意力

系统为您推荐了相关专利信息

基于多源知识引导变异的网络协议模糊测试方法和系统

消息协议待测服务器模糊测试系统动态污点分析

一种基于无人机集群的电力线路协同巡检系统

无人机集群巡检系统拓扑特征超图模型电力设备节点

一种智能媒体资源的多模态数据管理系统

数据分布数据管理系统媒体资源管理多模态存储库

业务告警分级处理方法、装置、计算机设备及存储介质

历史告警关键词计算机可读指令通知指标

一种基于状态空间模型的事件相机单目深度估计方法

状态空间模型单目深度估计方法事件相机空间模块编码器

基于模态语义空间对齐的学习视频推荐方法、介质、设备

站点导航

APP 下载