发声位置确定方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202410718254

申请日期：2024-06-04

公开号：CN118691672A

公开日期：2024-09-24

类型：发明专利

摘要

本申请公开了一种发声位置确定方法、装置、计算机设备及存储介质，该方法包括：获取当前视频帧的发声信息；基于对象标识信息，确定当前视频帧的对象数量；若对象数量大于或等于第一数量阈值且小于第二数量阈值，基于对象位置信息确定当前视频帧的初始发声位置信息；基于发声置信度信息和发声标志位信息对初始发声位置信息进行调整，得到当前视频帧的目标发声位置信息。采用本申请的方法可以得到与画面更加匹配的发声位置信息，并且可以缓解由于发声识别时间所带来的效果延迟。

技术关键词

发声人脸偏转角度对象标志位视频帧置信度阈值标识计算机设备队列图像识别模型处理器场景可读存储介质模块存储器画面

发声位置确定方法、装置、计算机设备及存储介质

站点导航

APP 下载