摘要
本申请属于语音控制技术领域,具体公开了一种智能语音视频指挥调度方法及装置,其中方法包括:接收用户用于视频调度的语音指令;将语音指令输入至声纹鉴别模型,输出语音指令对应的用户声纹是否注册的声纹鉴别结果;若语音指令对应的用户声纹已注册,则将语音指令输入至语音识别MIN模型,输出语音识别文字;语音识别MIN模型通过语音识别BIG模型和改进孪生标签辅助模块辅助训练得到;基于语音识别文字确定视频指挥调度参数和控制接口信息,基于视频调度参数和控制接口信息生成控制指令,调动控制接口发送控制指令以进行视频指挥调度。本申请中语音识别MIN模型可以不连接国际互联网运行,同时具有较高的语音识别准确率。
技术关键词
指挥调度方法
控制接口
智能语音
视频
语音识别准确率
动态规划路径
生成控制指令
声纹特征
标签
指挥调度装置
计算机程序产品
语音控制技术
参数
处理器
语音识别模块
特征提取网络
可读存储介质
鉴别模块
系统为您推荐了相关专利信息
安全监控方法
对象检测模型
产线
卷积模块
监控设备
视频流
色彩
参数
图像处理方法
非临时性计算机可读存储介质