一种基于交叉注意力和序列注意力的视频切分方法及系统

正文

推荐专利

申请号：CN202411124069

申请日期：2024-08-16

公开号：CN118658104B

公开日期：2024-11-19

类型：发明专利

摘要

本发明提供的一种基于交叉注意力和序列注意力的视频切分方法及系统，涉及视频处理技术领域，本发明通过获取某一时间段的直播视频与商品信息；对商品信息与直播视频进行时间点检测，得到所有时间点;将商品信息与所有时间点进行多模态融合，以通过交叉注意力与序列注意力捕获两者之间的关系与关键信息，得到时间点商品特征向量;根据商品信息与所有时间点，遍历比较相邻时间点的时间点商品特征向量，对直播视频重新划分视频时间段，得到商品分类更加精准的第二切分视频。本发明能最大程度地召回商品关联视频的时间点，减少后续失误判断，充分捕获视频时间点与商品之间的关联关系，更加精确地识别直播视频的时间点，解决商品维度上的视频划分问题。

技术关键词

视频时间段交叉注意力机制文本商品特征序列音频 NLP技术关系多模态图像编码坐标点图片切分系统精确地识别语音关键词数据获取模块

系统为您推荐了相关专利信息

一种员工培训方法

员工自然语言客户深度学习算法评估算法

基于多模态特征嵌入与关键点特征对齐的大模型问诊系统

关键点特征多模态特征图像问诊系统医疗知识图谱

一种基于机器训练模型的Web交互方法与服务端

交互方法语句意图转化算法地理位置语义

一种基于思维链微调大模型的交通域服务语音自适应生成方法及系统

语音编码器语音识别模型解码器语音特征拼音

一种基于轨迹大数据的林区人为风险评估方法及系统

手机信令数据轨迹大数据林区风险评估方法网格

一种基于交叉注意力和序列注意力的视频切分方法及系统

站点导航

APP 下载