摘要
本申请公开了一种视频字幕信息生成方法、装置、设备、存储介质及程序产品,所述视频字幕信息生成方法,包括:从音频输出流中捕获实时音频数据;对实时音频数据进行音频识别,得到实时音频数据的音频语种以及第一字幕信息;基于音频语种和第一字幕信息,确定出视频字幕信息。
技术关键词
信息生成方法
字幕
信息生成程序
视频
语音识别模型
训练文本数据
信息生成装置
环形缓冲区
文本翻译模型
计算机程序产品
音频识别模块
序列特征
信息生成设备
上下文特征
分词
池化特征
系统为您推荐了相关专利信息
人脸识别监控方法
中央管理系统
面部图像数据
人脸图像数据
前台
多模态信息融合
图像字幕生成方法
聚类特征
图像特征提取
多头注意力机制
分类方法
识别特征
高分辨率遥感影像
深度学习模型
标签
出水总氮浓度
碳源投加方法
融合特征
数字孪生模型
碳源投加量
池化特征
视频帧
车辆行驶数据
人工智能方法
时间差