摘要
本发明公开了融合AI语音克隆与实时翻译的跨语言语音通话系统,涉及语音处理技术领域,包括:获得第一客户端的第一输入语音,进行语言类型识别获得第一输入语音语言类型;当第一输入语音语言类型与第二客户端语言类型标识不同,进行语义识别,获得第一输入语音文字识别结果;根据第二客户端语言类型标识对第一输入语音文字识别结果进行翻译,获得对应语音文字识别结果;获得第一输入语音的物理特征信息;根据物理特征信息和第二输入语音文字识别结果进行语音克隆,获得第二输入语音,共享至第二客户端。本发明解决现有技术在跨语言通话中缺乏个性化语音特征保留和实时性不足的技术问题,实现跨语言和个性化实时语音通话的技术效果。
技术关键词
语音文字识别
语音通话系统
分类准确率
客户端
物理特征提取
AI语音
特征提取模型
语义特征提取
个性化语音特征
标识
识别模块
全卷积神经网络
偏差
编码
数据
实时语音