双面透明屏翻译机的语音识别方法及系统

正文

推荐专利

双面透明屏翻译机的语音识别方法及系统

申请号：CN202510314261

申请日期：2025-03-17

公开号：CN119889323A

公开日期：2025-04-25

类型：发明专利

摘要

本申请涉及语音识别技术领域，提供了双面透明屏翻译机的语音识别方法及系统。该方法包括基于口音分析模型对语音信息进行分析，得到翻译机用户的口音类别；基于所述口音类别在数据库中匹配目标模型参数，并基于目标模型参数对预设的语音识别模型的模型参数进行更新，得到更新语音识别模型，并将语音信息输入所述更新语音识别模型，得到初始语音识别文本；获取初始语音识别文本对应的第二唇部变化视频；基于第一唇部变化视频与第二唇部变化视频判断初始语音识别文本是否合格；若不合格，基于唇部对比视频与唇部变化视频对初始语音识别文本进行优化，得到目标语音识别文本。该方法能够在复杂环境中提高语音识别结果的准确性。

技术关键词

语音识别文本语音识别方法语音识别模型翻译机透明屏视频分割方法语音特征机器人双面分帧方法序列语音识别系统参数语音识别技术语音识别模块视频帧依序

系统为您推荐了相关专利信息

临床试验不良事件信息的分析方法及设备

大语言模型文本拼音语音识别模型命名实体识别

应用于轨道交通的自助服务处理方法、介质和终端

自助服务终端交通文本序列特征画像

一种基于大语言模型的语音识别方法、系统、设备及介质

语音识别模型大语言模型语音识别方法术语信噪比

多模态语音识别方法、装置、设备及计算机可读介质

声学特征唇形特征语音识别模型注意力编码器语音编码

一种基于AI的英语听说能力综合提升方法及系统

发音英语 AI算法语音识别模型语音识别技术

双面透明屏翻译机的语音识别方法及系统

站点导航

APP 下载