摘要
本申请实施例公开了一种音频播放控制方法、装置、电子设备及存储介质,该方法包括:响应于音频生成请求,通过对象识别模型确定出目标对象的对象描述信息;根据该对象描述信息,通过音频生成模型确定与该目标对象匹配的目标音频;播放该目标音频。通过对象识别模型确定目标对象的对象描述信息,提升对象描述信息的准确性和效率,以及,基于该对象描述信息确定与目标对象匹配的目标音频,提升该目标音频与目标对象的匹配度,提升用户体验,而通过音频生成模型确定目标音频则提升确定音频的效率。
技术关键词
音频播放控制方法
对象识别模型
音频播放控制装置
皮肤特征信息
身体特征信息
对象检测模型
面部特征信息
电子设备
表情特征
处理器
播放模块
元素
播放器
存储器
服饰
图像
风格
主题
系统为您推荐了相关专利信息
图像采集设备
入户门
图像处理方法
人脸
对象识别模型
图像
对象识别模型
计算机执行指令
人机交互界面
服务端
三维点云地图
车辆周围环境
图像信息处理方法
激光雷达
图像信息处理装置
车载前视
道路拥堵状态
对象识别模型
图像
影像设备