视频语义token压缩方法、视频识别方法和电子设备

正文

推荐专利

申请号：CN202511054680

申请日期：2025-07-30

公开号：CN120881297A

公开日期：2025-10-31

类型：发明专利

摘要

本申请提供了一种视频语义token压缩方法、视频识别方法和电子设备，其中，该方法可以包括：对原始视频进行处理，获得待编码视频；其中，所述待编码视频的帧数比所述原始视频的帧数少；对所述待语义编码视频进行语义编码，获得所述待编码视频对应的原始token数据集；对所述原始token数据集进行压缩，获得目标token数据集。通过上述方法，能够将视频以及视频的语义token进行压缩，该目标token数据集后续如果作为大模型的输入的情况下，可以降低大模型语义理解所需的计算量，从而可以实现大模型对长视频能进行高效准确的理解，并降低设备存储压力。

技术关键词

数据视频识别方法相邻两帧图像关键帧机器可读指令语义计算机程序产品电子设备自定义信息分辨率处理器可读存储介质编码策略对象存储器时序

系统为您推荐了相关专利信息

基于相似日训练集的低天气分辨率光伏预测方法及系统

天气预报数据光伏预测方法混合深度学习模型光伏发电数据光伏发电量

基于遥感影像融合与多级确认的水体提取方法及系统

水体提取方法卫星遥感影像融合方法无人机数据像素

一种拉绳位移传感器及其控制方法

拉绳位移传感器控制策略校正策略消除噪声干扰智能算法

一种用于酒店的自动派单方法及系统

订单任务分配策略客服自动派单方法决策树算法

一种多模态传感器协同的涂装质量智能控制系统

多模态传感器智能控制系统学习控制模型中控模块电热水器

视频语义token压缩方法、视频识别方法和电子设备

站点导航

APP 下载