基于多尺度与CLIP语义监督的AI视频质量评估方法及装置

正文

推荐专利

申请号：CN202411040266

申请日期：2024-07-31

公开号：CN118982777B

公开日期：2025-09-30

类型：发明专利

摘要

本发明公开了一种基于多尺度与CLIP语义监督的AI视频质量评估方法及装置，该方法结合了CLIP语义监督和交叉注意力机制。具体实现包括：为了对视频内容中嵌入的信息进行最大化提取和利用，分别从单个帧、帧片段和整个视频三个层面进行视频分析；为了确保生成的视频与提供的提示保持一致，本发明引入了提示语义监督模块，该模块利用CLIP文本编码器的编码能力，语义地评估视频与提示之间的一致性；考虑到人工智能生成视频的语义变化，本发明还引入了语义突变感知模块，该模块具备捕捉帧间微妙语义变化的基本建模能力。最终，通过我们精心设计的模型，可以有效地评估人工智能生成视频的质量。

技术关键词

语义多尺度视频段文本编码器视频帧特征图像编码器 Sigmoid函数交叉注意力机制数据视频分支适配器计算机程序产品视频分析处理器评估装置模块可读存储介质

系统为您推荐了相关专利信息

用于智能客服问答场景的提示词话术热更新处理方法

问答场景扩展问答知识库智能客服系统存储模块问答对数据

一种对多层语义高级威胁知识进行识别的方法及装置

语义实体关系建模语义技术识别网络攻击知识本体

一种基于融合特征降维的Fca-ProRes2Net说话人识别方法

说话人识别方法 Softmax函数说话人识别模型融合特征动静态特征

基于多时空尺度指标动态耦合的湖库型水源保护区精准划分方法

多时空尺度耦合特征保护区动态权重分配空间多尺度

基于局部自注意力的轻量级图像超分辨率网络

图像超分辨率神经网络单元局部特征提取代表滑动窗口

基于多尺度与CLIP语义监督的AI视频质量评估方法及装置

站点导航

APP 下载