视频会议多模态实时摘要生成方法

AITNT
正文
推荐专利
视频会议多模态实时摘要生成方法
申请号:CN202511116733
申请日期:2025-08-11
公开号:CN120980187A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及视频会议数据处理技术领域,公开了视频会议多模态实时摘要生成方法,该方法通过同步采集会议的音频流、视频流及文字聊天记录,经预处理转换为时间对齐的文本、关键帧序列及有效聊天内容;随后提取文本语义特征、视觉场景特征及交互意图特征,通过多模态融合模型进行跨模态关联分析,生成融合特征集合;基于此识别核心议题、关键结论及行动项,按时间顺序和重要程度结构化组织,形成实时摘要并动态更新。该方法整合多维度信息,解决了传统单一模态摘要的片面性问题,提升了摘要的完整性、准确性与时效性,助力参会者实时掌握会议重点,提高会议效率与决策质量。
技术关键词
摘要生成方法 多模态 场景特征 文本 语义特征 融合特征 语音识别模型 关键帧 卷积神经网络提取图像特征 视频流 音频 意图 动态更新 会议现场 关键词提取模型 视觉 跨模态 麦克风阵列采集
系统为您推荐了相关专利信息
1
一种口腔黏膜压力性损伤检测方法
损伤检测方法 图像分割器 图像编码器 编码特征 压力
2
基于多模态情绪感知的心理状态监测方法及装置
心理状态参数 模态特征 多模态情绪 心理状态监测装置 多头注意力机制
3
一种基于解码层的变电站造价估算方法与系统
变电站 造价估算方法 多头注意力机制 解码 参数
4
一种基于多窗口融合自注意力模型的皮带损伤分类方法
多窗口 注意力模型 分类方法 网络结构 分支
5
一种基于多模态时空数据建模的多层网络状态预测方法
网络状态预测方法 多模态 节点 EM算法 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号