一种基于AI大模型的视觉交互多功能机器人

正文

推荐专利

申请号：CN202411878105

申请日期：2024-12-19

公开号：CN119806324A

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了一种基于AI大模型的视觉交互多功能机器人，该产品具备独立操作及作为电脑配件的双重功能。在独立模式下，机器人通过按键唤醒、指定唤醒词或实时监听对话三种方式激活语音对话，将语音转换为文字，利用哈希算法处理后发送至大模型，并实时将大模型的回答转换为语音反馈。其创新之处在于情绪识别与表情同步能力，通过情感人工智能算法分析用户语音中的情绪特征，并实时调整表情以实现情感共鸣，提升用户体验。连接至电脑时，机器人可控制鼠标移动、点击操作，通过人脸识别解锁电脑，手势控制应用打开及模拟键盘输入，同时支持语音控制播放电影、快进、全屏等操作，显著提高工作效率和用户互动的趣味性。

技术关键词

多功能机器人手势识别单元激活语音对话机器学习算法手势轨迹识别电脑支持语音控制人脸识别解锁面部识别习惯多尺度特征融合计算机视觉技术人工智能算法命令识别手指动态手势

一种基于AI大模型的视觉交互多功能机器人

站点导航

APP 下载