一种面向多模态大模型实时视频处理的加速方法

AITNT
正文
推荐专利
一种面向多模态大模型实时视频处理的加速方法
申请号:CN202510258348
申请日期:2025-03-06
公开号:CN120455702A
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开一种面向多模态大模型实时视频处理的加速方法,其特征在于,包括:利用GPU的硬件编解码模块对输入的视频流进行实时解码,并通过GPU并行计算实现多路视频流的并发解码;将解码后的视频数据通过GPU核进行2D图像处理,利用自定义优化的PTX底层指令对图像进行颜色空间转换,将YUV格式转换为BGR格式,优化过程中通过整数运算替代浮点运算;通过自定义PTX指令集对GPU的执行单元进行优化,包括线程调度、内存访问模式、指令执行顺序的优化,确保数据处理过程中的并行计算加速;在GPU内部优化内存访问模式和数据传输方式,减少内存瓶颈和延迟,设计多模态视频处理流水线的显存使用与数据传输策略,避免主机端与设备端之间的无效数据传输。
技术关键词
内存访问模式 多模态 数据传输策略 实时视频 硬件编解码 动态资源调度 数据传输方式 多线程并行计算 硬件解码 GPU并行计算 多处理器 视频解码 视频分析 编解码器 设备端 视频流 指令优化 流水线
系统为您推荐了相关专利信息
1
一种基于多模态协同的构网型电力系统稳定控制方法
电力系统稳定控制方法 多模态协同 虚拟惯量 电网频率偏差 多能源
2
基于稳定扩散模型的快速人脸图像超分辨率方法及系统
人脸图像超分辨率 噪声预测器 视觉 注意力 噪声图像
3
一种基于人工智能的光伏组件质量检测方法
生成对抗网络 光伏组件表面 分层注意力 区域检测算法 多模态特征
4
一种多模态智能数字人的人机交互方法和系统
人机交互方法 监测数据处理 情感倾向识别 语音声学特征 性能监测数据
5
JSQ6型凹底双层运输车车门状态自动检测预警方法
双层运输车 车门 压电触觉传感器 预警方法 多模态数据融合
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号