摘要
本公开的实施例涉及语音识别的方法、装置、设备和存储介质。在此提出的方法包括:将获取的语音数据的响度调整至预设的响度范围,语音数据来自与构音障碍相关的对象;从语音数据中提取与语音活动相关联的至少一个语音片段;向模型提供至少一个语音片段的音频特征,以生成第一文本内容,其中模型是基于与预设的响度范围相关联的训练语音而被训练;以及基于至少一项文本表达约束,调整第一文本内容的文本表达,以确定与语音数据对应的识别结果。以此方式,本公开的实施例能够提高语音数据(例如,包括构音障碍的语音数据)所识别的文本内容的准确性。另外,通过本公开的实施例,能够提升构音障碍人士的互动效率。
技术关键词
语音
微调单元
音频特征
计算机可执行指令
文本去重
数据
语义
元素
处理器
电子设备
对象
参数
可读存储介质
模块
存储器
字符
系统为您推荐了相关专利信息
监测预警方法
智能穿戴设备
模式识别算法
加速度
指标
数据分析方法
音频特征
融合特征
视频
数据分析模型
基准特征
预训练模型
特征点集合
人工智能平台
序列
情感识别方法
融合特征
文本情感分类
文本分类器
文本特征向量