基于多模态智能体驱动的OTT视觉特征提取系统及方法

正文

推荐专利

申请号：CN202511156485

申请日期：2025-08-19

公开号：CN120676177B

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及互联网电视服务技术领域，具体为基于多模态智能体驱动的OTT视觉特征提取系统及方法，包括：捕获设备的屏幕实时视频流；对目标广告图像及实时视频流进行处理，通过多模态视觉感知模型提取出双流异构视觉特征，包括全局内容感知特征和局部几何结构特征；执行分层匹配算法，利用全局内容感知特征进行计算筛选出候选帧，在候选帧内利用局部几何结构特征进行匹配建立包含所有匹配的初始关键点对应关系集合，对集合进行空间聚类分离出广告实例，通过几何变换计算获得实例的边界框；根据边界框，在原始视频帧上对目标广告所在区域进行高亮显示生成可视化监播结果。本发明通过多模态智能体驱动，实现OTT广告视觉特征提取与监播。

技术关键词

视觉特征提取实时视频流感知特征广告关键点多模态注意力编码器通道注意力机制物联网接口生成高分辨率指令异构多层感知机空间邻近关系图像屏幕

系统为您推荐了相关专利信息

一种基于人脸特征的自动化图像处理方法及系统

自动化图像处理面部关键点检测人脸检测算法人脸特征识别技术贴图

一种用于全景图像的目标检测方法

坐标投影方法图像投影映射关系表 RANSAC算法

一种模拟真实场景的卫星图像仿真方法及系统

模拟真实场景运动图像序列关键点三维模型图像仿真系统

视频合成方法、装置和电子设备

分割掩模姿态特征对象图像视频

个性化心脏模型中左心室壁分层的设置方法

心脏模型左心室离子通道心肌细胞心脏电生理研究

基于多模态智能体驱动的OTT视觉特征提取系统及方法

站点导航

APP 下载