摘要
本申请提供了一种字幕生成方法、控制器、可穿戴设备及存储介质,适用于可穿戴设备的技术领域。该方法包括:接收通信设备发送的音频数据;其中,音频数据用于向佩戴可穿戴设备的目标对象播放;采用预设的字幕生成管道,基于音频数据进行文字转换,获取文字信息;基于文字信息,控制显示屏显示与文字信息对应的字幕。本申请实施例实现了不需要在音频数据播放时再通过可穿戴设备的麦克风采集环境声,从而提高了音频文字转换的准确性,同时避免了云端数据传输带来的隐私泄露的风险,也提高了文字转换的效率。而且,本申请实施例还可以基于姿态信息进行语言选择,也可以在显示屏上显示方位信息,使得用户可以根据自己感兴趣的音频数据进行智能选择。
技术关键词
字幕生成方法
生成管道
可穿戴设备
音频
通信设备
机器学习引擎
虚拟现实VR眼镜
数据
解密
头戴设备
显示屏
AI眼镜
MR眼镜
控制器
可读存储介质
对象
AR眼镜
处理器
系统为您推荐了相关专利信息
蓝牙芯片
联动控制系统
电源转换芯片
数字音频功放
LED光源
门控循环神经网络
语音活动检测
通道注意力机制
频谱特征
噪声特征
音频分类方法
特征提取模块
音频波形数据
重构模块
音频分类装置