一种汽车行业术语语音识别方法及装置、存储介质

AITNT
正文
推荐专利
一种汽车行业术语语音识别方法及装置、存储介质
申请号:CN202411667381
申请日期:2024-11-20
公开号:CN119479628B
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及语音识别领域,公开了一种汽车行业术语语音识别方法及装置、存储介质。所述方法包括:构建中文word‑phone发音词典和汽车专业术语BPE‑phone发音词典;使用中文语音数据对初始化的基础语音识别模型进行训练;从基础语音识别模型中进行参数权重的迁移,在迁移的模型上使用中文语音数据对目标语音识别模型进行训练。本发明实施例在仅需要少量高质量汽车专业术语语音数据集和大量无标注汽车专业术语语音数据的情况下,就可以高效训练得到效果较好的语音识别系统。最终得到的语音识别系统,不使用参数量过大的预训练模型,保证了语音识别的速度,降低了实际应用时对硬件的要求。
技术关键词
语音识别模型 发音词典 语音识别方法 分词词典 术语 语音识别系统 训练声学模型 编码器解码器 汽车 字符 语音识别装置 编码器结构 数据 列表 序列 基础 语音特征
系统为您推荐了相关专利信息
1
基于多模态消息的人机对话处理方法、装置、设备及介质
消息 多模态 图像识别模型 生成智能 视频识别
2
基于AI大模型的智能规范知识检索系统
知识检索系统 语义向量 索引 术语 动态更新
3
知识图谱构建方法、装置、设备及介质
依存句法树 实体识别模型 实体依存关系 数据 三元组
4
保险条款文件自动识别与快速结构化的方法
大语言模型 脚本 规范化技术 键值 数据
5
基于实时反馈的面试官评估偏见校正方法及系统
校正方法 偏差 文本 语义 意图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号