摘要
本发明涉及图像处理技术领域,尤其涉及一种高光合集生成方法及系统,所述方法先获取视频素材,再将视频素材进行片段分割后输入多模态模型中进行高光提取,得到多个高光候选片段,然后基于预设的时空约束,将多个高光候选片段进行时间戳校验,接着,将通过时间戳校验的高光候选片段进行视觉内容与文本摘要语义的强制对齐,最后将通过强制对齐的高光候选片段按时间顺序进行片段合并,输出高光合集。相较于现有技术,本发明方法克服了现有技术整合视频逻辑割裂及核心信息把握不准确的技术问题。
技术关键词
生成方法
计算机程序指令
摘要
多模态
视频
语义
文本
视觉
图像处理技术
表达式
生成系统
存储器
逻辑
处理器
符号
机制
核心
参数
系统为您推荐了相关专利信息
多模态
模块
数据整合机制
音频信号处理技术
优先级调度策略
智能配货方法
订单
锚点
余弦距离计算方法
混合整数规划模型
支气管镜
灰度共生矩阵
计算机视觉
三维点云数据
可见光波段
可移动机器人
视频采集设备
管理设备
订单
追溯系统
界面探测方法
近钻头
决策
声波系统
随钻测量技术