一种基于多摄像机视线追踪与大模型集成的多模态交互智能机器人系统

正文

推荐专利

申请号：CN202510998604

申请日期：2025-07-18

公开号：CN120891921A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于多摄像机视线追踪与大模型集成的多模态交互智能系统及方法，属于机器人技术领域。为解决现有技术视线追踪不准、多模态融合不足、交互不智能的问题，本发明的技术方案要点包括：通过多摄像机阵列计算用户三维视线向量，并利用神经网络进行个性化校准以提升精度；基于精确时间戳，将视线向量与语音、手势等其他模态数据进行同步融合，形成统一的上下文向量；将该向量提交至预训练大模型进行意图理解与决策，并驱动交互终端执行任务。本发明能够显著提升人机交互的准确性与自然度，可广泛应用于教育、医疗及科学研究等领域。

技术关键词

交互终端摄像机阵列数据处理单元校准智能机器人系统轻量级神经网络神经网络模型麦克风阵列采集多模态数据融合智能系统意图精确时间戳手势模块图形用户界面生成机器语音机器人技术

系统为您推荐了相关专利信息

一种基于3D视觉检测的玻璃磨边数字化检测系统及方法

玻璃磨边设备数字化检测系统粗糙度数字化检测方法校准激光器

一种芯片颗粒的加热测试装置

加热测试装置温度控制模块数据分析模块待测芯片测试电路

一种汽车扣件生产线的检测系统

汽车扣件倍速链输送升降组件滑轨组件搬运机器人

车辆中制动系统的状态识别方法、系统、车辆和存储介质

制动系统时域特征频域特征融合特征状态识别方法

基于知识-数据双驱动的施工人员数量统计方法及系统

数量统计方法注意力机制数据获取单元融合可见光图像拉普拉斯

一种基于多摄像机视线追踪与大模型集成的多模态交互智能机器人系统

站点导航

APP 下载