双面透明屏翻译机的语音识别方法及系统

AITNT
正文
推荐专利
双面透明屏翻译机的语音识别方法及系统
申请号:CN202510314261
申请日期:2025-03-17
公开号:CN119889323A
公开日期:2025-04-25
类型:发明专利
摘要
本申请涉及语音识别技术领域,提供了双面透明屏翻译机的语音识别方法及系统。该方法包括基于口音分析模型对语音信息进行分析,得到翻译机用户的口音类别;基于所述口音类别在数据库中匹配目标模型参数,并基于目标模型参数对预设的语音识别模型的模型参数进行更新,得到更新语音识别模型,并将语音信息输入所述更新语音识别模型,得到初始语音识别文本;获取初始语音识别文本对应的第二唇部变化视频;基于第一唇部变化视频与第二唇部变化视频判断初始语音识别文本是否合格;若不合格,基于唇部对比视频与唇部变化视频对初始语音识别文本进行优化,得到目标语音识别文本。该方法能够在复杂环境中提高语音识别结果的准确性。
技术关键词
语音识别文本 语音识别方法 语音识别模型 翻译机 透明屏 视频分割方法 语音特征 机器人 双面 分帧方法 序列 语音识别系统 参数 语音识别技术 语音识别模块 视频帧 依序
系统为您推荐了相关专利信息
1
临床试验不良事件信息的分析方法及设备
大语言模型 文本 拼音 语音识别模型 命名实体识别
2
应用于轨道交通的自助服务处理方法、介质和终端
自助服务终端 交通 文本 序列特征 画像
3
一种基于大语言模型的语音识别方法、系统、设备及介质
语音识别模型 大语言模型 语音识别方法 术语 信噪比
4
多模态语音识别方法、装置、设备及计算机可读介质
声学特征 唇形特征 语音识别模型 注意力编码器 语音编码
5
一种基于AI的英语听说能力综合提升方法及系统
发音 英语 AI算法 语音识别模型 语音识别技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号