摘要
本申请公开了一种视频处理方法、装置、设备、存储介质及程序产品,涉及数据处理技术领域,包括:若检测到视频播放设备输出当前播放视频,则通过预设麦克风采集所述视频播放设备所处外界环境的环境音频信号;从所述环境音频信号中提取语音信号,并将所述语音信号输入预设的语音识别模型得到语音识别文本;基于所述语音识别文本确定所述当前播放视频的专业领域,基于所述专业领域对应预设的词汇库对所述语音识别文本进行调整,得到目标识别文本;将所述目标识别文本和所述当前播放视频关联保存至预设存储空间。本申请实现了提高语音转录的准确性。
技术关键词
语音识别文本
语音识别模型
视频播放设备
信号
音频
专业
降噪模型
发言人
视频段
计算机程序产品
注意力机制
时间段
麦克风
标识
识别模块
身份
数据处理技术