一种基于多模态大模型的直播视频流分析方法及系统

正文

推荐专利

申请号：CN202510971575

申请日期：2025-07-15

公开号：CN120475195B

公开日期：2025-10-14

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的直播视频流分析方法及系统，主要涉及多模态的图片分析技术领域。包括：启动流媒体服务器、ASR服务以及多模态模型服务；在所述流媒体服务器中创建房间，通过直播客户端将直播的视频流推送到所述房间；利用Python脚本连接至所述流媒体服务器的房间；所述音频监听线程对监听到的音频帧进行降噪和人声检测；将拼接后的文本及图片数组通过HTTP请求发送至所述多模态模型服务进行分析，获取分析结果并返回给用户。本发明的有益效果在于：它解决了直播视频流中音频流分析及视频流分析关联性低的问题。

技术关键词

视频流分析方法流媒体服务器多模态音频房间人声标志位短时傅里叶变换 HTTP请求图片分析技术深度神经网络分析系统视频帧估计噪声功率文本客户端

系统为您推荐了相关专利信息

一种基于多模态大模型的国际传播受众反馈讽刺检测方法

图片相似性度量函数文本特征向量多模态数据

知识图谱与规则约束相结合的数据智能分析方法及系统

马尔可夫逻辑网络数据智能分析方法关系抽取技术 CRF模型构建知识图谱

基于双极优化的多模态无人机轨迹预测方法及系统

轨迹预测方法无人机关键点注意力机制优化器

一种多模态反馈增强的积木自闭症疗愈控制方法及设备

量表场景聚类分析算法 LED灯光颜色主题

一种基于多模态混合专家模型的软件漏洞检测方法与装置

软件漏洞检测方法多模态混合专家网络融合策略软件漏洞检测技术

一种基于多模态大模型的直播视频流分析方法及系统

站点导航

APP 下载