一种多方言的语音文本转换系统及处理方法

正文

推荐专利

一种多方言的语音文本转换系统及处理方法

申请号：CN202411899044

申请日期：2024-12-23

公开号：CN119673147B

公开日期：2025-12-09

类型：发明专利

摘要

本发明涉及语言识别技术领域，具体为一种多方言的语音文本转换系统及处理方法，包括：音频采集模块：负责采集用户的语音输入，支持PCM、MP3、WAV格式和16kHz、44.1kHz采样率；方言检测模块：利用预训练语言分类器识别语音输入的方言类型；语音特征提取模块：将语音信号转化为特征表示，如梅尔频谱、MFCC；多方言语音识别模块：基于多任务学习的语音识别模型，将特征映射为文本序列；文本后处理模块：根据语言规则和语境优化识别结果，输出最终的标准化文本。多方言支持：覆盖主要方言语种，并可通过迁移学习快速扩展至新方言。

技术关键词

文本转换系统语音特征提取语音识别模型音频采集模块语音识别模块后处理模块多线程并行处理解码算法语言识别技术语言模型概率多任务多模态特征融合采样率识别说话人序列分类器训练语料库

系统为您推荐了相关专利信息

基于多配置分块上下文转换器模型的语音识别方法及装置

语音识别模型语音识别方法分块转换器注意力

一种离线会议记录盒子及其语音识别系统

语音识别系统信号背景噪声滑动窗口音频特征

一种重症护理翻身装置

护理翻身装置卷绕辊卷扬装置导向辊伺服电机

一种基于六自由度运动模拟的航空客舱警务培训系统

六自由度运动平台客舱培训系统模拟器磁致伸缩位移传感器

一种房屋质量安全投诉自动分类方法及装置

多任务学习模型自动分类方法文本物业管理系统预训练语言模型

一种多方言的语音文本转换系统及处理方法

站点导航

APP 下载