摘要
本发明属于智能识别技术领域,具体涉及一种电子白板实时字幕与翻译的智能场景识别方法,通过使用的一份特定的语音训练集分别实现对场景识别模型和文本识别模型进行训练,并实现两个模型之内在输出结果上的相互协同,简化训练集,使用两个模型的输出结果之间进行印证,提高两个模型训练的精度。通过对发言者语音的识别对场景下的杂音的过滤以及减少杂音干扰场景的识别进而进一步的影响语音的转译,还通过两模型之间的相互配合,实现对目标语音的场景的精确识别,进而根据不同的场景得到精确的翻译文本,且通过将场景识别和场景识别结果对应的文本识别在两个模型之间获取,降低错误率。
技术关键词
智能场景识别方法
文本识别模型
电子白板
语音特征
字幕
发言者
训练集
循环卷积神经网络
音色特征
节点
循环神经网络模型
智能识别技术
卷积神经网络模型
麦克风
信号
场景特征
系统为您推荐了相关专利信息
语音情感识别模型
适配器
语音特征
分配器
识别方法
文本识别模型
生成测试脚本
图形用户界面
测试方法
人工智能模型