一种基于AI大模型的视觉交互多功能机器人

AITNT
正文
推荐专利
一种基于AI大模型的视觉交互多功能机器人
申请号:CN202411878105
申请日期:2024-12-19
公开号:CN119806324A
公开日期:2025-04-11
类型:发明专利
摘要
本发明公开了一种基于AI大模型的视觉交互多功能机器人,该产品具备独立操作及作为电脑配件的双重功能。在独立模式下,机器人通过按键唤醒、指定唤醒词或实时监听对话三种方式激活语音对话,将语音转换为文字,利用哈希算法处理后发送至大模型,并实时将大模型的回答转换为语音反馈。其创新之处在于情绪识别与表情同步能力,通过情感人工智能算法分析用户语音中的情绪特征,并实时调整表情以实现情感共鸣,提升用户体验。连接至电脑时,机器人可控制鼠标移动、点击操作,通过人脸识别解锁电脑,手势控制应用打开及模拟键盘输入,同时支持语音控制播放电影、快进、全屏等操作,显著提高工作效率和用户互动的趣味性。
技术关键词
多功能机器人 手势识别单元 激活语音对话 机器学习算法 手势轨迹识别 电脑 支持语音控制 人脸识别解锁 面部识别 习惯 多尺度特征融合 计算机视觉技术 人工智能算法 命令 识别手指 动态手势
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号