摘要
本发明公开了一种基于多模态的具身智能设备控制方法、系统及终端,所述方法包括:获取经过烧录的智能卡驱动,控制智能卡驱动,部署多模态模型,并对多模态模型进行训练,得到目标多模态模型;获取用户输入的语音信息,并将语音信息输入目标多模态模型,输出提示词;将提示词传输到具身智能设备中,控制具身智能设备运行,并获取运行结果。本发明在训练多模态模型时,对数据进行预处理后,将不同模态数据转换成相同尺度或分布,通过图结构对齐数据,提高了模型训练的效率和模型训练后的性能。
技术关键词
多模态
智能设备控制方法
人形机器人
智能设备控制系统
语音
物品识别模型
广义线性模型
机械臂
比特流
输出提示词
样本
视觉特征
控制智能卡
构建训练集
信息处理模块
数据
系统为您推荐了相关专利信息
空调调控方法
跨模态
文本
适配器技术
设备健康管理
船舶导航方法
人机交互系统
语音识别引擎
数据处理单元
定位系统
语音转换系统
鲁棒性评估方法
噪声参数
生成语音
数据
光斑检测方法
深度学习模型
变色油墨
光斑检测装置
数据