摘要
本发明涉及人工智能技术领域,可应用于机械臂智能抓取、金融科技及医疗健康等业务场景中,公开了一种目标物品智能抓取控制方法、装置、设备及介质,包括:获取目标物品图像、物品描述文本和机械臂关节状态;通过视觉编码器提取视觉特征向量;通过语言编码器生成语义向量;将视觉特征向量与语义向量输入语言模型进行特征融合,生成多模态理解信息;基于多模态理解信息和机械臂关节状态,通过动作解码器生成机械臂关节位移指令;控制机械臂执行机械臂关节位移指令以抓取目标物品。本发明通过融合多源信息,提升了机械臂对目标物品的理解能力,结合机械臂状态信息,实现了复杂环境下的精准抓取与高效控制,增强了系统的稳定性与适应性。
技术关键词
机械臂关节
智能抓取
语言编码器
语义向量
多模态
抓取动作
文本
语义特征
解码器
融合多源信息
图像
指令
视觉特征提取
注意力
计算机设备
驱动信号
系统为您推荐了相关专利信息
图像特征编码
BERT模型
自然语言
样本
跨模态
隧道机电设备
多网融合
通信控制系统
同步控制模块
网络同步
电力设施
检测分析方法
三维模型
多模态
广义极值分布
锂电池
时间序列特征
生成对抗网络
热管理策略
深度神经网络