一种面向多模态大模型实时视频处理的加速方法

正文

推荐专利

申请号：CN202510258348

申请日期：2025-03-06

公开号：CN120455702A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开一种面向多模态大模型实时视频处理的加速方法，其特征在于，包括：利用GPU的硬件编解码模块对输入的视频流进行实时解码，并通过GPU并行计算实现多路视频流的并发解码；将解码后的视频数据通过GPU核进行2D图像处理，利用自定义优化的PTX底层指令对图像进行颜色空间转换，将YUV格式转换为BGR格式，优化过程中通过整数运算替代浮点运算；通过自定义PTX指令集对GPU的执行单元进行优化，包括线程调度、内存访问模式、指令执行顺序的优化，确保数据处理过程中的并行计算加速；在GPU内部优化内存访问模式和数据传输方式，减少内存瓶颈和延迟，设计多模态视频处理流水线的显存使用与数据传输策略，避免主机端与设备端之间的无效数据传输。

技术关键词

内存访问模式多模态数据传输策略实时视频硬件编解码动态资源调度数据传输方式多线程并行计算硬件解码 GPU并行计算多处理器视频解码视频分析编解码器设备端视频流指令优化流水线

系统为您推荐了相关专利信息

一种基于多模态协同的构网型电力系统稳定控制方法

电力系统稳定控制方法多模态协同虚拟惯量电网频率偏差多能源

基于稳定扩散模型的快速人脸图像超分辨率方法及系统

人脸图像超分辨率噪声预测器视觉注意力噪声图像

一种基于人工智能的光伏组件质量检测方法

生成对抗网络光伏组件表面分层注意力区域检测算法多模态特征

一种多模态智能数字人的人机交互方法和系统

人机交互方法监测数据处理情感倾向识别语音声学特征性能监测数据

JSQ6型凹底双层运输车车门状态自动检测预警方法

双层运输车车门压电触觉传感器预警方法多模态数据融合

一种面向多模态大模型实时视频处理的加速方法

站点导航

APP 下载