一种基于语言驱动的视频阴影检测方法、装置及相关设备

正文

推荐专利

申请号：CN202411095240

申请日期：2024-08-09

公开号：CN119206562A

公开日期：2024-12-27

类型：发明专利

摘要

本申请提出了一种基于语言驱动的视频阴影检测方法、装置及相关设备，涉及视频处理领域，该方法首先获取目标视频数据以及自然语言指令；对自然语言指令进行解析，确定目标视频数据中的目标检测区域；根据目标检测区域，对每一视频帧进行阴影检测，得到每一视频帧中目标检测区域对应的初始阴影检测结果；将目标视频数据划分成多个记忆片段，每个记忆片段划分为多个连续的记忆块，每个记忆块包括多个连续的视频帧；最后，根据每一视频帧对应的记忆块以及每一视频帧对应的记忆片段，对初始阴影检测结果进行优化，得到每一视频帧中目标检测区域对应的目标阴影检测结果。该方法通过自然语言描述指定视频中的特定阴影区域，能够提高阴影检测的灵活性。

技术关键词

视频帧视频阴影检测方法记忆自然语言饱和度图像注意力阴影检测装置 HSV颜色空间数据指令分词大语言模型解析单元处理器可读存储介质存储器

系统为您推荐了相关专利信息

一种电力服务场景下的对话状态跟踪模型优化系统及方法

模型优化系统对话策略人工智能语音交互计算机可执行指令自然语言

基于多尺度融合与自适应平滑的视频防抖方法及系统

视频防抖方法运动补偿运动特征视频帧多维特征向量

一种基于滑动窗口的长视频生成方法

视频生成方法滑动窗口视频生成模型样本生成短视频

基于大语言模型与扩散模型的非常态交通态势生成方法

噪声预测大语言模型交通生成方法语义

企业资产管理方法及相关设备

智能货柜机器人服务器对象配送软件开发工具包

一种基于语言驱动的视频阴影检测方法、装置及相关设备

站点导航

APP 下载