基于机器视觉的语音输入等待控制方法、系统及存储介质

AITNT
正文
推荐专利
基于机器视觉的语音输入等待控制方法、系统及存储介质
申请号:CN202411136371
申请日期:2024-08-19
公开号:CN119091881B
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了基于机器视觉的语音输入等待控制方法、系统及介质,包括:响应于语音识别激活指令,获取目标乘员舱的第一图像信息,并获取目标乘员的第一语音信息;根据第一语音信息判断语音输入是否完整;当确定语音输入不完整,根据第一图像信息确定目标乘员的面部表情时序数据和人体姿态时序数据,进而根据面部表情时序数据和人体姿态时序数据判断目标乘员是否说话中断;当确定目标乘员说话中断,在预设的语音输入等待时长内获取目标乘员的第二语音信息,进而根据第一语音信息和第二语音信息合成得到目标语音输入信息。本发明提高了语音输入的便利性和用户的驾乘体验,可广泛应用于车辆控制技术领域。
技术关键词
乘员 语音输入信息 时序 面部 数据 车载语音识别 语音采集装置 视觉 样本 图像采集装置 人体关键点检测 车辆控制技术 处理器 指令 文本 程序 标签
系统为您推荐了相关专利信息
1
一种井下装载机爬坡角度获取方法及系统
井下装载机 爬坡角度 序列 因子 倾角传感器
2
一种具有预测功能的汽车充气泵及其预测方法
汽车充气泵 汽车轮胎气压变化 胎压 随机森林模型 LSTM神经网络模型
3
电刺激装置、电刺激装置的控制方法
电刺激装置 数据 对象 参数 电阻抗
4
一种商业空间内不同场景的用户消费行为分析方法及系统
无线定位装置 轨迹模型 分析方法 热力图 分布式环境
5
一种物联网控制器
物联网控制器 通信模组 脉冲宽度调制 射频天线模块 模拟输出模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号