一种多维增强的开放词汇视频实例分割方法

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
一种多维增强的开放词汇视频实例分割方法
申请号:CN202511456527
申请日期:2025-10-13
公开号:CN120913135B
公开日期:2025-12-02
类型:发明专利
摘要
本发明提供了一种多维增强的开放词汇视频实例分割方法,包括:步骤1,通过数学建模与分析,提出一种新型的开放词汇分割思想;步骤2,对用户输入的视频进行预处理,进行帧采样,并通过分别强化类别文本和图像特征、查询向量的交互,在Transformer架构中实现类别相关的分割;步骤3,采用实例驱动的TopK时序匹配策略,提高跨帧匹配的稳定性与准确性;步骤4,通过多尺度特征融合提升类别识别能力,优化目标分类。本发明能够高效进行开放词汇视频实例分割,并广泛应用于视频监控、自动驾驶、视频索引等领域,推动视频理解与推理技术的发展。
技术关键词
记忆存储单元 对象 视频实例分割方法 文本编码器 像素 融合特征 图像编码器 时序 多尺度特征融合 解码器 置信度阈值 语义 预训练模型 文本特征向量 自然语言 融合策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号