摘要
本发明提供一种基于多模态数据融合的纪要自动生成方法、系统、装置及产品,该方法包括:获取交互场景内的多模态数据,多模态数据包括音频信息和视频信息;基于深度学习技术对多模态数据进行特征提取,包括提取音频信息得到转录文本,提取视频信息得到视觉特征;获取与交互场景对应的关联提示信息;根据关联提示信息动态匹配预设的摘要模板;结合转录文本、视觉特征、关联提示信息、摘要模板形成结构化文档;将结构化文档输入预训练模型得到纪要文档;按照发送设置将纪要文档发送给指定的接收用户。本发明提高纪要文档生成的效果,并能够兼容不同的交互场景,应用范围广泛。
技术关键词
多模态数据融合
自动生成方法
视觉特征
深度学习技术
转换文本
多模态数据采集
自动生成系统
电子白板
预训练模型
摘要
模板
场景
音频
视频
手写体识别
图像处理模型
传输模块
系统为您推荐了相关专利信息
缺陷检测系统
轮胎胎面
3D点云数据
三维点云数据
多模态数据融合
深度学习识别方法
冻融循环次数
损伤特征
残差神经网络
扫描电子显微镜
降水预测方法
多模态特征融合
特征提取网络
融合特征
权重特征
异构卷积神经网络
序列特征
恶意代码分类
恶意代码检测方法
多模态特征融合
鸟瞰图像
多模态数据融合
激光雷达点云数据
K近邻算法
训练集