一种多方言的语音文本转换系统及处理方法

AITNT
正文
推荐专利
一种多方言的语音文本转换系统及处理方法
申请号:CN202411899044
申请日期:2024-12-23
公开号:CN119673147B
公开日期:2025-12-09
类型:发明专利
摘要
本发明涉及语言识别技术领域,具体为一种多方言的语音文本转换系统及处理方法,包括:音频采集模块:负责采集用户的语音输入,支持PCM、MP3、WAV格式和16kHz、44.1kHz采样率;方言检测模块:利用预训练语言分类器识别语音输入的方言类型;语音特征提取模块:将语音信号转化为特征表示,如梅尔频谱、MFCC;多方言语音识别模块:基于多任务学习的语音识别模型,将特征映射为文本序列;文本后处理模块:根据语言规则和语境优化识别结果,输出最终的标准化文本。多方言支持:覆盖主要方言语种,并可通过迁移学习快速扩展至新方言。
技术关键词
文本转换系统 语音特征提取 语音识别模型 音频采集模块 语音识别模块 后处理模块 多线程并行处理 解码算法 语言识别技术 语言模型概率 多任务 多模态特征融合 采样率 识别说话人 序列 分类器 训练语料库
系统为您推荐了相关专利信息
1
基于多配置分块上下文转换器模型的语音识别方法及装置
语音识别模型 语音识别方法 分块 转换器 注意力
2
一种离线会议记录盒子及其语音识别系统
语音识别系统 信号 背景噪声 滑动窗口 音频特征
3
一种重症护理翻身装置
护理翻身装置 卷绕辊 卷扬装置 导向辊 伺服电机
4
一种基于六自由度运动模拟的航空客舱警务培训系统
六自由度运动平台 客舱 培训系统 模拟器 磁致伸缩位移传感器
5
一种房屋质量安全投诉自动分类方法及装置
多任务学习模型 自动分类方法 文本 物业管理系统 预训练语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号