摘要
本申请公开了一种语音处理方法、装置、设备、介质及产品。所述方法包括:获取目标对象的待识别语音数据,待识别语音数据包括目标对象的声学特征;将待识别语音数据输入到预先构建的语音处理系统中,得到待识别语音数据对应的文本数据,语音处理系统至少包括ASR模型和预先训练的PLM模型,PLM模型是根据多个训练文本和ASR模型输出的语音识别结果训练得到的,语音识别结果是根据目标对象的历史语音数据得到的,待识别语音数据与历史语音数据的声学特征一致。根据本申请实施例,能够在不改变ASR模型参数或结构的前提下提高针对某个特定说话人的语音识别准确性。
技术关键词
识别语音数据
声学特征
计算机程序指令
文本
对象
语音识别准确性
计算机程序产品
校正
电子设备
可读存储介质
处理器
输入模块
参数
存储器
系统为您推荐了相关专利信息
补全策略
知识图谱补全方法
计算机程序指令
化工装置
知识本体
客户
生成个性化推荐
深度学习算法
策略
谱分析技术
监控方法
异构
图像特征提取
标记标签
建立关联关系