融合AI语音克隆与实时翻译的跨语言语音通话系统

AITNT
正文
推荐专利
融合AI语音克隆与实时翻译的跨语言语音通话系统
申请号:CN202411610115
申请日期:2024-11-12
公开号:CN119580703A
公开日期:2025-03-07
类型:发明专利
摘要
本发明公开了融合AI语音克隆与实时翻译的跨语言语音通话系统,涉及语音处理技术领域,包括:获得第一客户端的第一输入语音,进行语言类型识别获得第一输入语音语言类型;当第一输入语音语言类型与第二客户端语言类型标识不同,进行语义识别,获得第一输入语音文字识别结果;根据第二客户端语言类型标识对第一输入语音文字识别结果进行翻译,获得对应语音文字识别结果;获得第一输入语音的物理特征信息;根据物理特征信息和第二输入语音文字识别结果进行语音克隆,获得第二输入语音,共享至第二客户端。本发明解决现有技术在跨语言通话中缺乏个性化语音特征保留和实时性不足的技术问题,实现跨语言和个性化实时语音通话的技术效果。
技术关键词
语音文字识别 语音通话系统 分类准确率 客户端 物理特征提取 AI语音 特征提取模型 语义特征提取 个性化语音特征 标识 识别模块 全卷积神经网络 偏差 编码 数据 实时语音
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号