摘要
本发明公开了一种基于用户交互式指令的视频片段定位方法,包括以下步骤:(1)将视频内容按照镜头进行拆分;(2)使用图像文字识别和语音识别技术提取视频文本内容;(3)对图像文字识别和语音识别结果进行校准,并使用自然语言处理模型提取文本摘要;(4)将文本识别结果按照时间节点与镜头关联对应;(5)计算文本摘要与原始文本的相似性,得到文本摘要和原始文本以及视频镜头的对应关系;(6)基于图像识别与理解技术对视频画面进行识别标记;(7)根据用户文本指令,计算与图像标记以及文本摘要的匹配关系,快速定位对应的视频镜头片段。本发明解决了用户在视频定位过程中,定位不便,耗时过长的问题,提升了用户观看体验。
技术关键词
视频片段定位方法
摘要
交互式指令
文本识别
镜头
语音识别技术
理解技术
识别标记
图像文字识别技术
匹配识别方法
关键帧
关系
自然语言
画面
系统为您推荐了相关专利信息
动态权重分配
节点
数据获取模块
追溯系统
电数字数据处理技术