摘要
本公开所涉及的移动体控制系统包含存储器以及一个以上的处理器,当存储于存储器的命令由一个以上的处理器执行时,使一个以上的处理器进行如下处理:获取图像;获取包含相对的位置关系的基于自然语言的用户的指示;以及使用一个以上的机器学习模型,基于使表示在图像中拍摄到的场景的特征量的图像特征量、在图像中拍摄到的场景的深度、以及表示用户的指示所涉及的语言上的特征量的语言特征量融合而成的融合特征量,对与用户的指示所示的场景内的位置对应的图像内的区域进行预测。
技术关键词
机器学习模型
移动体控制系统
图像特征量
信息处理装置
融合特征
场景
自然语言
处理器
存储器
生成机器学习
命令
关系
注意力机制
数据
像素
系统为您推荐了相关专利信息
牵引力控制方法
脊柱矫正设备
分布特征
机器学习模型
指数
文本识别方法
特征提取网络
图像特征提取
融合特征
数据