摘要
本申请涉及网络直播领域,公开一种直播间语音对话变声方法及其装置、设备、介质,所述方法包括:响应直播间中发言用户的语音发言事件,检测确定目标音频数据中的语音片段;根据预设的目标音高值,对所述语音片段的片段音高特征进行变调处理,得到调优音高特征;基于所述调优音高特征和目标音色特征,对所述语音片段做变声处理,得到变声片段;将所述变声片段替换所述目标音频数据中的相应语音片段,得到变声音频数据,将所述变声音频数据发送给所述直播间中的受话用户。本申请显著提升了语音变声技术的性能,解决了传统技术中的实时性、个性化服务、音高调整自然性以及音色真实还原等方面的问题。
技术关键词
音色特征
变声方法
音频
对象
数据
非易失性可读存储介质
语音变声技术
模板
人声
语义特征
中央处理器
变声装置
计算机可读指令
分析模块
列表
存储器
界面
样本
系统为您推荐了相关专利信息
路面
特征提取模型
系统级芯片
采样率
计算机可读性存储介质
数据管理方法
逻辑回归模型
管理系统
计划
合规性检测方法
工业大数据
智能决策方法
智能决策系统
混合智能优化算法
模拟退火算法
叠后地震数据
地震属性体
蒙特卡洛算法
统计岩石物理
曲线
海上风电机组
预测控制方法
预测控制系统
多时间尺度
注意力机制