摘要
本申请涉及AR影像处理领域,提供一种增强现实影像的合成方法,装置、设备及存储介质,包括:获取待转换为增强现实影像的音视频信息,对视频信息进行前景提取,并基于提取到的目标前景与音频信息合成目标影像;获取待应用于增强现实影像中的文本信息;将文本信息输入预设文本处理模型,在预设文本处理模型中对文本信息进行文本处理操作,得到目标文本信息;对目标影像和目标文本信息进行合成处理,得到第一增强现实影像;获取待融合影像和待融合声音,并将待融合影像和待融合声音与第一增强现实影像进行融合处理,得到目标增强现实影像。该方法向用户提供特定场景下的智能讲解、便于用户理解讲解内容,提高了用户的体验感。
技术关键词
文本处理模型
影像
高斯混合模型
音视频
像素点
色彩
情感特征
计算机设备
音频
参数
信息处理模块
视频背景
可读存储介质
存储计算机程序
录像设备
处理器
场景