摘要
本发明涉及分诊设备领域,具体是一种用于分诊的AI智能终端,在采集用户的音频数据的同时,采集用户的面部视频数据,对用户的面部视频数据进行分析,从而提取出用户在说话时的目标时间区段。通过筛选出目标时间区段的目标音频数据,可以将一些高频环境声滤除,配合高通滤波,可以将嘈杂环境中大部分干扰声滤除。进而将目标音频数据进行文字转换、实体提取以及智能分诊,本申请得到的分诊结果不受环境音干扰,更加准确。
技术关键词
智能终端
音频
数据
人脸关键点提取
图像
面部识别模型
实体
视频
动态
分诊设备
智能分诊
人工神经网络
特征值
时间段
样本
输出模块
基准
系统为您推荐了相关专利信息
阵列相机
控制采集模块
FPGA系统
图像采集器
双分支网络
分布式发电配电网
人工神经网络
神经网络训练数据
静止无功发生器
神经网络模型
电磁暂态模型
机电暂态模型
新能源场站
大电网连锁故障
母线