字幕生成方法、控制器、可穿戴设备及存储介质

正文

推荐专利

申请号：CN202511045150

申请日期：2025-07-28

公开号：CN120812362A

公开日期：2025-10-17

类型：发明专利

摘要

本申请提供了一种字幕生成方法、控制器、可穿戴设备及存储介质，适用于可穿戴设备的技术领域。该方法包括：接收通信设备发送的音频数据；其中，音频数据用于向佩戴可穿戴设备的目标对象播放；采用预设的字幕生成管道，基于音频数据进行文字转换，获取文字信息；基于文字信息，控制显示屏显示与文字信息对应的字幕。本申请实施例实现了不需要在音频数据播放时再通过可穿戴设备的麦克风采集环境声，从而提高了音频文字转换的准确性，同时避免了云端数据传输带来的隐私泄露的风险，也提高了文字转换的效率。而且，本申请实施例还可以基于姿态信息进行语言选择，也可以在显示屏上显示方位信息，使得用户可以根据自己感兴趣的音频数据进行智能选择。

技术关键词

字幕生成方法生成管道可穿戴设备音频通信设备机器学习引擎虚拟现实VR眼镜数据解密头戴设备显示屏 AI眼镜 MR眼镜控制器可读存储介质对象 AR眼镜处理器

系统为您推荐了相关专利信息

基于互补融合的全媒体融合方法及系统

媒体融合方法数据存储格式化特征提取模块

一种音箱投影灯的声光联动控制系统

蓝牙芯片联动控制系统电源转换芯片数字音频功放 LED光源

基于扩张因果卷积和双向门控循环神经网络的语音增强方法

门控循环神经网络语音活动检测通道注意力机制频谱特征噪声特征

一种多模态社交网络舆情隐患排查方法及系统

隐患排查方法拓扑特征多模态分布式边缘网络

一种基于特征解耦和对比学习的音频分类方法及装置

音频分类方法特征提取模块音频波形数据重构模块音频分类装置

字幕生成方法、控制器、可穿戴设备及存储介质

站点导航

APP 下载