摘要
本发明提供一种基于分层式混合模型的具身智能机器人的控制方法,涉及具身智能领域。本发明基于协同式混合模型架构,按照ASR文本对应的任务复杂度动态分配处理路径,将简单任务分配至低延迟的本地文本小模型处理,将复杂任务分配至高精度的远程多模态大模型处理,在交互体验、响应速度、任务适应性等方面显著提升具身智能机器人的性能,同时降低计算与通信开销。此外,基于音频和文本的双重评估置信度方法,进一步确保了语音识别的准确性和鲁棒性。
技术关键词
智能机器人
多模态
WebSocket协议
智能语音
音频特征
置信度方法
分层
序列
文本理解
动作列表
队列
识别模块
分析模块
程序
存储器
鲁棒性
处理器
系统为您推荐了相关专利信息
振幅型空间光调制器
并行识别方法
多模态信息
多模态特征
触觉信息
人脸活体检测方法
可见光图像
权重特征
融合特征
多模态