融合AI语音克隆与实时翻译的跨语言语音通话系统

正文

推荐专利

申请号：CN202411610115

申请日期：2024-11-12

公开号：CN119580703A

公开日期：2025-03-07

类型：发明专利

摘要

本发明公开了融合AI语音克隆与实时翻译的跨语言语音通话系统，涉及语音处理技术领域，包括：获得第一客户端的第一输入语音，进行语言类型识别获得第一输入语音语言类型；当第一输入语音语言类型与第二客户端语言类型标识不同，进行语义识别，获得第一输入语音文字识别结果；根据第二客户端语言类型标识对第一输入语音文字识别结果进行翻译，获得对应语音文字识别结果；获得第一输入语音的物理特征信息；根据物理特征信息和第二输入语音文字识别结果进行语音克隆，获得第二输入语音，共享至第二客户端。本发明解决现有技术在跨语言通话中缺乏个性化语音特征保留和实时性不足的技术问题，实现跨语言和个性化实时语音通话的技术效果。

技术关键词

语音文字识别语音通话系统分类准确率客户端物理特征提取 AI语音特征提取模型语义特征提取个性化语音特征标识识别模块全卷积神经网络偏差编码数据实时语音

融合AI语音克隆与实时翻译的跨语言语音通话系统

站点导航

APP 下载