实时语音的变音方法、终端设备和存储介质

AITNT
正文
推荐专利
实时语音的变音方法、终端设备和存储介质
申请号:CN202510645848
申请日期:2025-05-20
公开号:CN120183419B
公开日期:2025-08-01
类型:发明专利
摘要
本发明适用于音频处理领域,公开了一种实时语音的变音方法、终端设备和存储介质。实时语音的变音方法包括:根据实时对话音频,生成原始语音数据,并根据原始语音数据,确定条件特征、多样性特征、填充数据掩码;根据条件特征、多样性特征、填充数据掩码,确定第一张量信息,并根据原始语音数据,确定说话人嵌入向量;根据第一张量信息、说话人嵌入向量、填充数据掩码,确定第二张量信息;根据第二张量信息、说话人嵌入向量和原始语音数据的音高频率,生成目标音色音频。本发明显著提升了变声过程对原始音色特征的重构精度,使生成语音在音色相似度、语调自然度等感知维度达到类真人水平,提高了实时语音的变音真实性。
技术关键词
实时语音 音频 数据 流式解码器 一维卷积神经网络 频谱特征 语音特征 终端设备 融合特征 音色特征 可读存储介质 相位对齐 波形 生成语音 处理器 频率 算法 上采样 存储器
系统为您推荐了相关专利信息
1
空调器的控制方法、装置和电子设备
可靠性参数 空间转换矩阵 设备状态数据 神经网络模型 空调器部件
2
基于事件要素图的跨境民族文化事件检索方法及装置
事件检索方法 事件触发词 文本编码器 事件相关度计算方法 嵌入方法
3
一种储层属性反演方法、装置、设备及存储介质
属性反演方法 检波器 储层反演 加速度 输入神经网络模型
4
一种膜层低损伤的IC芯片石英基板镀膜工艺
石英基板 镀膜工艺 溅射镀膜机 蒸发镀膜机 镀膜设备
5
一种联锁人机界面操作显示系统的检测系统及检测方法
人机界面 图像识别模块 数据采集模块 语音识别模块 模拟鼠标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号