一种基于用户交互式指令的视频片段定位方法

正文

推荐专利

申请号：CN202510713017

申请日期：2025-05-30

公开号：CN120612638A

公开日期：2025-09-09

类型：发明专利

摘要

本发明公开了一种基于用户交互式指令的视频片段定位方法，包括以下步骤：(1)将视频内容按照镜头进行拆分；(2)使用图像文字识别和语音识别技术提取视频文本内容；(3)对图像文字识别和语音识别结果进行校准，并使用自然语言处理模型提取文本摘要；(4)将文本识别结果按照时间节点与镜头关联对应；(5)计算文本摘要与原始文本的相似性，得到文本摘要和原始文本以及视频镜头的对应关系；(6)基于图像识别与理解技术对视频画面进行识别标记；(7)根据用户文本指令，计算与图像标记以及文本摘要的匹配关系，快速定位对应的视频镜头片段。本发明解决了用户在视频定位过程中，定位不便，耗时过长的问题，提升了用户观看体验。

技术关键词

视频片段定位方法摘要交互式指令文本识别镜头语音识别技术理解技术识别标记图像文字识别技术匹配识别方法关键帧关系自然语言画面

系统为您推荐了相关专利信息

一种基于司法公证和非对称秘钥的文档在线签署认证方法

认证方法面部特征信息电子印章私钥哈希算法

多媒体资源发布方法、装置、电子设备及存储介质

资源发布方法多媒体账号客户端电子设备

一种光伏电站设计规则库的管理方法及系统

光伏电站日志管理方法计算机可执行指令摘要

一种危重病患往期病史追溯系统及方法

动态权重分配节点数据获取模块追溯系统电数字数据处理技术

雷达装置、可移动平台及雷达装置的组装方法

雷达装置对位工艺镜头芯片电路板

一种基于用户交互式指令的视频片段定位方法

站点导航

APP 下载