摘要
本申请涉及语音识别技术领域,提供了双面透明屏翻译机的语音识别方法及系统。该方法包括基于口音分析模型对语音信息进行分析,得到翻译机用户的口音类别;基于所述口音类别在数据库中匹配目标模型参数,并基于目标模型参数对预设的语音识别模型的模型参数进行更新,得到更新语音识别模型,并将语音信息输入所述更新语音识别模型,得到初始语音识别文本;获取初始语音识别文本对应的第二唇部变化视频;基于第一唇部变化视频与第二唇部变化视频判断初始语音识别文本是否合格;若不合格,基于唇部对比视频与唇部变化视频对初始语音识别文本进行优化,得到目标语音识别文本。该方法能够在复杂环境中提高语音识别结果的准确性。
技术关键词
语音识别文本
语音识别方法
语音识别模型
翻译机
透明屏
视频分割方法
语音特征
机器人
双面
分帧方法
序列
语音识别系统
参数
语音识别技术
语音识别模块
视频帧
依序
系统为您推荐了相关专利信息
大语言模型
文本
拼音
语音识别模型
命名实体识别
语音识别模型
大语言模型
语音识别方法
术语
信噪比
声学特征
唇形特征
语音识别模型
注意力编码器
语音编码