智能语音视频指挥调度方法及装置

AITNT
正文
推荐专利
智能语音视频指挥调度方法及装置
申请号:CN202411739904
申请日期:2024-11-29
公开号:CN119580709B
公开日期:2025-10-21
类型:发明专利
摘要
本申请属于语音控制技术领域,具体公开了一种智能语音视频指挥调度方法及装置,其中方法包括:接收用户用于视频调度的语音指令;将语音指令输入至声纹鉴别模型,输出语音指令对应的用户声纹是否注册的声纹鉴别结果;若语音指令对应的用户声纹已注册,则将语音指令输入至语音识别MIN模型,输出语音识别文字;语音识别MIN模型通过语音识别BIG模型和改进孪生标签辅助模块辅助训练得到;基于语音识别文字确定视频指挥调度参数和控制接口信息,基于视频调度参数和控制接口信息生成控制指令,调动控制接口发送控制指令以进行视频指挥调度。本申请中语音识别MIN模型可以不连接国际互联网运行,同时具有较高的语音识别准确率。
技术关键词
指挥调度方法 控制接口 智能语音 视频 语音识别准确率 动态规划路径 生成控制指令 声纹特征 标签 指挥调度装置 计算机程序产品 语音控制技术 参数 处理器 语音识别模块 特征提取网络 可读存储介质 鉴别模块
系统为您推荐了相关专利信息
1
一种多模态与多任务联合的光场图像盲质量评价方法
文本特征向量 评价方法 多任务 视觉特征 多模态
2
一种智慧社区的宠物管理方法及装置
宠物管理方法 智慧社区 标识 识别算法 编码算法
3
基于智能识别的短视频生产方法
视频 摘要 关键字 关键词提取方法 语音
4
一种基于机器视觉的产线安全监控方法及系统
安全监控方法 对象检测模型 产线 卷积模块 监控设备
5
图像处理方法、装置、电子设备、芯片和存储介质
视频流 色彩 参数 图像处理方法 非临时性计算机可读存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号