摘要
本发明公开了基于机器视觉的语音输入等待控制方法、系统及介质,包括:响应于语音识别激活指令,获取目标乘员舱的第一图像信息,并获取目标乘员的第一语音信息;根据第一语音信息判断语音输入是否完整;当确定语音输入不完整,根据第一图像信息确定目标乘员的面部表情时序数据和人体姿态时序数据,进而根据面部表情时序数据和人体姿态时序数据判断目标乘员是否说话中断;当确定目标乘员说话中断,在预设的语音输入等待时长内获取目标乘员的第二语音信息,进而根据第一语音信息和第二语音信息合成得到目标语音输入信息。本发明提高了语音输入的便利性和用户的驾乘体验,可广泛应用于车辆控制技术领域。
技术关键词
乘员
语音输入信息
时序
面部
数据
车载语音识别
语音采集装置
视觉
样本
图像采集装置
人体关键点检测
车辆控制技术
处理器
指令
文本
程序
标签
系统为您推荐了相关专利信息
汽车充气泵
汽车轮胎气压变化
胎压
随机森林模型
LSTM神经网络模型
无线定位装置
轨迹模型
分析方法
热力图
分布式环境
物联网控制器
通信模组
脉冲宽度调制
射频天线模块
模拟输出模块