摘要
本发明公开了一种基于多源异构信息融合的会议纪要自动生成方法,包括:利用人脸识别技术提取发言者面部特征并识别其人脸身份;通过麦克风阵列获取音频信号,利用声纹识别技术识别发言者声纹身份;结合视频和音频信息,通过多源异构信息融合技术:在时间上进行视频和音频数据的对齐;通过音源定位技术,在空间上将声纹身份和人脸身份进行匹配对齐,精确定位并识别发言者身份;对发言人和发言内容进行标定与分离,确保发言人身份与发言内容的准确匹配;利用自然语言处理和深度学习模型,根据标定后的发言内容生成发言人摘要及会议纪要。该方法适用于各类会议场景,能够识别不同发言人的发言内容,生成发言人摘要,提高会议纪要生成的效率和准确性。
技术关键词
多源异构信息融合
自动生成方法
会议纪要
音源定位技术
动态时间规整技术
声纹识别技术
发言人
人脸身份
人脸识别技术
麦克风阵列
会议场景
深度卷积神经网络算法
识别发言者身份
面部特征
深度学习模型
音频
自然语言
声纹特征
系统为您推荐了相关专利信息
工控协议
自动生成方法
通用数据模型
节点
工控系统
多模态特征
自动生成方法
归一化植被指数
多尺度特征金字塔
分支
智能生成方法
摘要
递归神经网络
基础
生成会议纪要
测试用例自动生成方法
信息熵
测试用例集
覆盖率
测试用例自动生成系统