摘要
本申请实施例公开一种音轨切换方法及电子设备,该方法包括:在播放第一音轨对应的第一音频流时,通过检测装置采集多模态数据;利用卷积神经网络模型对多模态数据进行归一化处理,得到多模态特征向量并输入至上下文预测模型,由上下文预测模型预测匹配于多模态数据的目标音轨;检测第一音频流的静音段、过零率点、能量平稳段和谐波稳定段,由此获取候选点集合;从候选点集合中选择目标候选点;对第一音轨和目标音轨进行相位对齐,并在目标候选点处切换至目标音轨,以播放目标音轨对应的第二音频流。这样,预测符合用户实际偏好的目标音轨,并自动匹配目标音轨的切换时机,消除听觉断层,提升音轨切换效率。
技术关键词
播放历史信息
多模态
音轨切换方法
音频输出装置
卷积神经网络模型
指令
执行器
模态特征
相位对齐
数据
谐波
音频特征
长短期记忆网络
电子设备
置信度阈值
听觉
缓冲池
视觉
系统为您推荐了相关专利信息
数字孪生驱动
起落架
高应力
生成对抗网络
动态时间规整方法
全球定位系统数据
轨迹预测方法
注意力机制
多模态环境
LSTM预测方法
网络拓扑特征
网络安全事件
历史监测数据
实时监测数据
编码模块