摘要
本发明公开了一种多路视频流管理方法及系统,涉及人工智能的技术领域,解决了多路视频流智能管理系统对具体任务的泛化性较差,且使用场景局限性大的技术问题。该方法包括在边缘侧设备上部署微调多模态大语言模型,形成处理多路视频流的智能体,并对处理多路视频流的相关任务进行自定义任务配置;通过提示词工程,根据自定义任务配置形成对智能体提问的提示词;获取多路视频流关键的图像帧,将图像帧与提示词作为智能体的输入,以使智能体对处理多路视频流的相关任务进行推理;解析智能体的推理结果,形成规范的目标任务,按照自定义任务配置执行目标任务。本发明增强了智能体对具体任务的泛化性,能够适用于更多不同的场景。
技术关键词
视频流管理
大语言模型
多模态
智能管理系统
图像
答案
文本
格式
度函数
指令
场景
参数
多通道
控制模块
模板
编码
序列
系统为您推荐了相关专利信息
电力系统暂态稳定分析
融合特征提取
数据驱动模型
暂态稳定评估
仿真数据
协同控制系统
多模态
履带主体
悬崖传感器
双目摄像头
激光焊接控制方法
后台服务器
焊缝
图像采集模块
焊接设备