字幕生成方法、控制器、可穿戴设备及存储介质

AITNT
正文
推荐专利
字幕生成方法、控制器、可穿戴设备及存储介质
申请号:CN202511045150
申请日期:2025-07-28
公开号:CN120812362A
公开日期:2025-10-17
类型:发明专利
摘要
本申请提供了一种字幕生成方法、控制器、可穿戴设备及存储介质,适用于可穿戴设备的技术领域。该方法包括:接收通信设备发送的音频数据;其中,音频数据用于向佩戴可穿戴设备的目标对象播放;采用预设的字幕生成管道,基于音频数据进行文字转换,获取文字信息;基于文字信息,控制显示屏显示与文字信息对应的字幕。本申请实施例实现了不需要在音频数据播放时再通过可穿戴设备的麦克风采集环境声,从而提高了音频文字转换的准确性,同时避免了云端数据传输带来的隐私泄露的风险,也提高了文字转换的效率。而且,本申请实施例还可以基于姿态信息进行语言选择,也可以在显示屏上显示方位信息,使得用户可以根据自己感兴趣的音频数据进行智能选择。
技术关键词
字幕生成方法 生成管道 可穿戴设备 音频 通信设备 机器学习引擎 虚拟现实VR眼镜 数据 解密 头戴设备 显示屏 AI眼镜 MR眼镜 控制器 可读存储介质 对象 AR眼镜 处理器
系统为您推荐了相关专利信息
1
基于互补融合的全媒体融合方法及系统
媒体 融合方法 数据存储 格式化 特征提取模块
2
一种音箱投影灯的声光联动控制系统
蓝牙芯片 联动控制系统 电源转换芯片 数字音频功放 LED光源
3
基于扩张因果卷积和双向门控循环神经网络的语音增强方法
门控循环神经网络 语音活动检测 通道注意力机制 频谱特征 噪声特征
4
一种多模态社交网络舆情隐患排查方法及系统
隐患排查方法 拓扑特征 多模态 分布式边缘 网络
5
一种基于特征解耦和对比学习的音频分类方法及装置
音频分类方法 特征提取模块 音频波形数据 重构模块 音频分类装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号