摘要
本申请一些实施例提供一种显示设备、服务器及唤醒词检测方法,所述方法可以响应于语音唤醒指令,获取连续多帧音频数据。并对多帧音频数据执行第一特征提取,以及将第一声学特征输入至声学模型,以得到第一概率值。若第一概率值大于第一阈值,则对音频数据执行第二特征提取,以及将第二声学特征输入至第一分类模型,以得到音频数据包含唤醒词的第一分类概率和音频数据包含常规词的第二分类概率。若第一分类概率大于第二分类概率,则生成唤醒指令,以及响应于唤醒指令,唤醒语音助手。所述方法采用多个模型对音频数据进行多次唤醒词检测,可以解决唤醒词检测技术的识别准确率低、唤醒率差且难以在算力低的平台上部署的问题。
技术关键词
声学特征
显示设备
音频输入接口
唤醒词检测方法
唤醒语音助手
训练声学模型
数据
显示用户界面
数值
指令
控制器
服务器
标签
参数
建立通信
存储器
显示器
系统为您推荐了相关专利信息
充电设备
图像识别模块
蓝牙耳机
控制模块
传感器模块
集群告警方法
防高空坠物
视频
终端显示设备
移动物体图像
多模态语音
交互注意力
节奏特征
声纹特征
语音编码器
终端设备
信息展示方法
关系
显示设备
信息展示装置