一种语音通话实时转写系统及方法

正文

推荐专利

一种语音通话实时转写系统及方法

申请号：CN202511028384

申请日期：2025-07-25

公开号：CN120526774B

公开日期：2025-11-18

类型：发明专利

摘要

本发明提供了一种语音通话实时转写系统及方法，涉及计算机技术领域，所述系统包括：网元模块用于当检测到用户端的通话请求时，获取对应的音频数据；语音送流引擎，用于基于预设感知加权矢量量化算法，对音频数据进行分层压缩，得到音频压缩数据，并对音频压缩数据进行格式转化处理，得到临时音频数据；语音引擎，用于对临时音频数据进行特征提取，得到多模态特征数据，并基于预设的语音识别模型对多模态特征数据进行处理，得到文本信息；分析优化模块，用于基于预设大模型，根据文本信息和预设词汇库得到对应的实时转写文本数据。本发明通过利用多模态特征数据，全面表征语音信息，使得语音识别模型能够更准确地进行语音到文本的转换。

技术关键词

数据多模态特征音频动态资源分配矢量量化算法语音识别模型文本声纹特征关键词字幕转写方法 MFCC特征 QoS等级 CRF模型模块网元机器学习算法术语

系统为您推荐了相关专利信息

基于SDR的网络拥塞链路诊断方法及系统

链路时延分类阈值混合聚类算法网络层析成像技术

数据处理方法、装置、设备和介质

分片文本多模态标识符样本

基于空地协同点云融合的老建筑数字化测绘系统及方法

空地协同地面机器人测绘方法点云无人机设备

一种基于双流-图卷积网络的供水管网全域水质预测方法

水质预测方法供水管网络结构信息空间拓扑结构节点特征

一种基于多模态复合机器学习模型的激光焊接熔透状态预测方法

复合机器学习模型状态预测方法信号激光融合特征

一种语音通话实时转写系统及方法

站点导航

APP 下载