一种低延迟实时语音转文字及文字转语音传输方法

正文

推荐专利

申请号：CN202410950383

申请日期：2024-07-16

公开号：CN118865942A

公开日期：2024-10-29

类型：发明专利

摘要

本发明涉及语音通信技术领域，特别涉及一种低延迟实时语音转文字及文字转语音传输方法，所述方法包括以下步骤：通过语音采集装置获取语音数据，并将语音数据发送至云端进行预处理；通过滑动时间窗口逐秒接收音频流数据；通过语音识别模型对滑动窗口内接收到的音频数据进行实时语音识别，生成初步文本；通过异步校正算法，在后台对初步文本进行二次校验和修正；通过文本转语音算法将文字转换为语音数据；通过实时传输协议进行数据传输，使用UDP协议来保证低延迟；同时，采用NACK(丢包重传机制)和/或FEC(前向错误纠正技术)来处理网络丢包问题，以此增强通信的稳定性和质量。

技术关键词

语音传输方法实时语音语音识别模型低延迟音频拥堵状况滑动时间窗口文本滑动窗口语音采集装置校正算法长短期记忆网络数据 LSTM模型语音算法消除背景噪音协议字词频谱特征

系统为您推荐了相关专利信息

基于级联的多模态数字人实时对话系统及方法

对话系统语音识别模块对话方法生成数字人工具包

DDS技术智能睡眠辅助枕头

智能睡眠 DDS芯片枕头输出模块多模态

一种音频数据的安全传输系统

音频子模块矩阵报文序列

一种智能化陆上风电节能减排管理方法及系统

管理方法设备健康管理低延迟数据设备状态监测齿轮箱温度

一种监控终端的视频数据获取方法及装置

视频数据获取方法监控终端在线图片音频特征

一种低延迟实时语音转文字及文字转语音传输方法

站点导航

APP 下载