摘要
本发明提出一种人形机器人自然语言操控方法。本发明通过构建机器人简单技能库和复杂技能库,有效降低了对大量特定领域操作数据的依赖。本发明利用大型语言模型作为任务规划器的基座,充分发挥了其情景学习、语义理解和常识推理的能力。通过引入计算机视觉领域的视觉模型,本发明能够获取环境的高层语义信息和低层空间信息,构建出精确的场景图作为环境状态表示。本发明构建的语音交互界面提高了人机交互的自然性,使得用户能够更加方便地与机器人进行沟通和指令输入,有效提升了用户体验,有利于人形机器人在实际应用场景中的推广。
技术关键词
人形机器人
高层语义信息
预训练模型
操控方法
自然语言
仿真环境
策略
特征点云
个性化机器人
机械臂运动规划
机器人末端执行器
场景
物体识别模型
路径规划功能
运动轨迹规划
开源机器人
闭环反馈机制
检测周围环境