摘要
本申请公开了一种音视频场景重建方法、装置、设备及存储介质,涉及计算机视觉技术领域,方法包括:通过相机阵列获取目标场景的场景深度图像;基于场景深度图像建立场景模型;识别场景深度图像中的人脸图像,并提取人脸图像中的人脸特征;将人脸特征与预设的面部模型进行拟合得到人脸图像对应的人脸模型;基于人脸图像在场景深度图像中的位置信息将人脸模型映射至场景模型中得到完整场景模型。本申请可以精准保存下会议的场景信息和每个参会人员的语言及面部信息,从而能更加完整且准确地对会议进行记录。
技术关键词
场景重建方法
人脸模型
人脸特征
音视频
麦克风阵列
人脸位置
计算机程序产品
网格模型
面部
计算机视觉技术
人脸识别模块
躯干模型
图像获取模块
处理器
坐标系
相机
信号
系统为您推荐了相关专利信息
风险预测模型
噪声数据
风险检测系统
移动平均滤波
数据采集模块
多模态数据融合
评估系统
数据获取模块
心理
信号检测器
大坝
视觉摄像头
数据处理计算机
麦克风阵列
雷达点云数据