音视频场景重建方法、装置、设备及存储介质

AITNT
正文
推荐专利
音视频场景重建方法、装置、设备及存储介质
申请号:CN202411960080
申请日期:2024-12-30
公开号:CN119379927A
公开日期:2025-01-28
类型:发明专利
摘要
本申请公开了一种音视频场景重建方法、装置、设备及存储介质,涉及计算机视觉技术领域,方法包括:通过相机阵列获取目标场景的场景深度图像;基于场景深度图像建立场景模型;识别场景深度图像中的人脸图像,并提取人脸图像中的人脸特征;将人脸特征与预设的面部模型进行拟合得到人脸图像对应的人脸模型;基于人脸图像在场景深度图像中的位置信息将人脸模型映射至场景模型中得到完整场景模型。本申请可以精准保存下会议的场景信息和每个参会人员的语言及面部信息,从而能更加完整且准确地对会议进行记录。
技术关键词
场景重建方法 人脸模型 人脸特征 音视频 麦克风阵列 人脸位置 计算机程序产品 网格模型 面部 计算机视觉技术 人脸识别模块 躯干模型 图像获取模块 处理器 坐标系 相机 信号
系统为您推荐了相关专利信息
1
一种噪声聋职业病风险检测系统及方法
风险预测模型 噪声数据 风险检测系统 移动平均滤波 数据采集模块
2
基于多模态数据融合的心理异常风险实时评估系统
多模态数据融合 评估系统 数据获取模块 心理 信号检测器
3
一种并发下发人脸数据到多台门禁设备的方法及系统
数据映射表 队列 生成设备 门禁设备 设备连接线
4
一种基于数字孪生的车辆异常噪声定位方法及系统
球形麦克风阵列 数字孪生 车辆 定位方法 坐标系
5
基于多模态数据处理的大坝测量系统及方法
大坝 视觉摄像头 数据处理计算机 麦克风阵列 雷达点云数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号