视频会议多模态实时摘要生成方法

正文

推荐专利

视频会议多模态实时摘要生成方法

申请号：CN202511116733

申请日期：2025-08-11

公开号：CN120980187A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及视频会议数据处理技术领域，公开了视频会议多模态实时摘要生成方法，该方法通过同步采集会议的音频流、视频流及文字聊天记录，经预处理转换为时间对齐的文本、关键帧序列及有效聊天内容；随后提取文本语义特征、视觉场景特征及交互意图特征，通过多模态融合模型进行跨模态关联分析，生成融合特征集合；基于此识别核心议题、关键结论及行动项，按时间顺序和重要程度结构化组织，形成实时摘要并动态更新。该方法整合多维度信息，解决了传统单一模态摘要的片面性问题，提升了摘要的完整性、准确性与时效性，助力参会者实时掌握会议重点，提高会议效率与决策质量。

技术关键词

摘要生成方法多模态场景特征文本语义特征融合特征语音识别模型关键帧卷积神经网络提取图像特征视频流音频意图动态更新会议现场关键词提取模型视觉跨模态麦克风阵列采集

系统为您推荐了相关专利信息

一种口腔黏膜压力性损伤检测方法

损伤检测方法图像分割器图像编码器编码特征压力

基于多模态情绪感知的心理状态监测方法及装置

心理状态参数模态特征多模态情绪心理状态监测装置多头注意力机制

一种基于解码层的变电站造价估算方法与系统

变电站造价估算方法多头注意力机制解码参数

一种基于多窗口融合自注意力模型的皮带损伤分类方法

多窗口注意力模型分类方法网络结构分支

一种基于多模态时空数据建模的多层网络状态预测方法

网络状态预测方法多模态节点 EM算法矩阵

视频会议多模态实时摘要生成方法

站点导航

APP 下载