一种基于语音交互与视觉透视的网约车乘客位置快速定位方法

正文

推荐专利

申请号：CN202411368765

申请日期：2024-09-29

公开号：CN119399845B

公开日期：2025-08-22

类型：发明专利

摘要

本发明提供一种基于语音交互与视觉透视的网约车乘客位置快速定位方法，涉及智能交通技术领域，其包含以下步骤：在汽车上布施传感器、摄像头、金属反光幕布及投影仪；采集司机的语音信息，设计智能化语音唤醒模型；构建场景化语音识别模型；使用“声音‑图像”的多级跨模态检测模型面向全景图像检测行人目标，获取行人目标的外观与姿态特征检测信息；设计“静态特征”匹配方法与“动态特征”识别模型，实现乘客特征信息匹配；基于匹配结果，确定乘客的位置信息；通过全景图像中的位置估计，获取以车辆为参考原点的乘客方向；根据方向估计结果，控制车内投影仪，将该乘客信息投影在车内相应方向的幕布上，并同时利用语音信息给予提示。

技术关键词

快速定位方法静态特征图像视觉投影仪语音唤醒模型司机多头注意力机制语音识别模型幕布坐标跨模态人体关键点骨骼特征文本编码器特征金字塔车载摄像头

系统为您推荐了相关专利信息

一种基于Transformer的多方向文本定位方法

文本定位方法图像端点编码器解码器

一种大尺寸复杂模型的3D打印切片方法

扫描线阵列补偿算法面片切片方法求交算法

用于调度灭火飞机的方法和系统

灭火飞机火情数据高程地图显示设备介质

一种基于深度学习的SLAM回环检测方法

回环检测方法词典数据库构建词典神经网络架构搜索图像全局特征

基于物联网的水电安全监控方法及系统

安全监控方法电子围栏系统无人机巡检安全监控系统视频监控系统

一种基于语音交互与视觉透视的网约车乘客位置快速定位方法

站点导航

APP 下载