摘要
本发明提供一种根据音频输入类型动态调整字幕与翻译模式的方法,采集多个来源的音频数据并预处理;基于智能音频信号分类算法构建音频分类模型并训练,划分音频数据的类别;将当前音频输入到音频分类模型中,确定当前音频所处的类别;构建音频类别、字幕与翻译模式两者的映射关系,根据当前音频所处的类别匹配对应的字幕与翻译模式,并实时显示字幕与翻译内容;基于当前音频所匹配到的字幕与翻译模式,自动隐藏相关选项设置;能够实时检测当前音频所处的类别,并根据音频类别动态调整字幕与翻译模式,根据字幕与翻译模式自动隐藏或是显示相关选项设置,减少不必要的设置选项,优化用户体验。
技术关键词
Welch算法
音频信号分类
模式
动态
显示字幕
梅尔频率倒谱系数
隐马尔可夫模型
音频采集设备
优化用户体验
序列
更新模型参数
维特比算法
数据
音频特征
识别码
定义