摘要
本申请公开了一种人机交互方法、装置、相关设备及计算机程序产品,涉及人工智能技术领域。其中人机交互方法包括,通过获取车内目标用户提出的交互问题,利用车内的第一摄像头拍摄来获取目标用户的影像,根据影像确定目标用户的视线方向信息,从而能够更好地理解用户的意图和需求。利用第一摄像头确定目标用户的视线方向信息,并据此调整第二摄像头的视角,并获取第二摄像头拍摄的车外图像,使得系统能够看到用户所关注的对象或场景,并通过调用多模态大模型,结合车外图像和用户的交互问题,能够进行更深层次的信息处理和理解,通过理解用户的交互问题,根据车外图像生成对应的回复结果,使得回复更加准确和相关,提高了交互的效率和质量。
技术关键词
多模态
人机交互方法
格式模板
图像
指令
车辆驾驶状态信息
计算机程序产品
影像
视角
距离信息
人机交互装置
坐标系
人工智能技术
处理器
眼球
信息处理
人眼
可读存储介质
存储器
电子设备