一种可控制时长的端到端语音翻译方法及翻译系统

AITNT
正文
推荐专利
一种可控制时长的端到端语音翻译方法及翻译系统
申请号:CN202510979491
申请日期:2025-07-16
公开号:CN120877707A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种可控制时长的端到端语音翻译方法及翻译系统,通过引入语音端到端的方案,有效减少翻译的延时;通过构建全新的tokenizer和引入token对齐方案,有效的控制翻译结果长度;通过对token时长的控制,加入长度控制变量,来引导跨语种音色、韵律克隆,以达到较为优秀的跨语种音色、韵律克隆。
技术关键词
语音翻译方法 发音 神经网络结构模型 序列 声音编解码器 语音翻译系统 语义 声码器 代表 多任务 发声 关系 分区 矩阵 框架 信号 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号