摘要
本发明公开了一种基于AI大模型的视觉交互多功能机器人,该产品具备独立操作及作为电脑配件的双重功能。在独立模式下,机器人通过按键唤醒、指定唤醒词或实时监听对话三种方式激活语音对话,将语音转换为文字,利用哈希算法处理后发送至大模型,并实时将大模型的回答转换为语音反馈。其创新之处在于情绪识别与表情同步能力,通过情感人工智能算法分析用户语音中的情绪特征,并实时调整表情以实现情感共鸣,提升用户体验。连接至电脑时,机器人可控制鼠标移动、点击操作,通过人脸识别解锁电脑,手势控制应用打开及模拟键盘输入,同时支持语音控制播放电影、快进、全屏等操作,显著提高工作效率和用户互动的趣味性。
技术关键词
多功能机器人
手势识别单元
激活语音对话
机器学习算法
手势轨迹识别
电脑
支持语音控制
人脸识别解锁
面部识别
习惯
多尺度特征融合
计算机视觉技术
人工智能算法
命令
识别手指
动态手势