摘要
本发明涉及图像数据提取技术领域,尤其涉及一种基于多模态模型的高光亮点提取方法及系统,所述方法在响应于视频素材的输入之后,先将视频素材进行片段分割,得到多个重叠子片段,然后将多个重叠子片段输入预设的多模态大模型中进行联合特征提取,得到混合特征,再从混合特征中提取出历史片段特征和当前片段特征,接着,将历史片段特征和当前片段特征输入预设的时空交叉注意力机制模型中,计算得到时间维度上的注意力得分矩阵,最后,将注意力得分矩阵中得分大于预设阈值的元素对应的高光片段作为高光亮点。相较于现有技术,本发明方法解决了现有技术针对性差及提取效率低的技术问题。
技术关键词
点提取方法
联合特征提取
多模态
交叉注意力机制
模态特征
视频
计算机程序指令
数据提取技术
矩阵
表达式
定义
分片
跨模态
框架
超参数
存储器
处理器
连续性