登录成功后会自动刷新界面
可自行托管的实时文本转语音模型
KugelAudio 是一款可自行部署的实时文本转语音 AI 模型,支持低于 60 毫秒的低延迟推理与语音克隆,可选择本地部署或通过 API 调用。它对语法规则敏感,可以自然处理电话号码、IBAN、地址和药品名称等特殊文本,支持超过 25 种语言、词级时间戳与 IPA 音标,还提供了 LiveKit、Pipecat 和 Vapi 的适配插件,由四人团队在柏林开发。