基于多模态预训练的动作生成方法、装置、机器人及介质

正文

推荐专利

申请号：CN202510730758

申请日期：2025-05-30

公开号：CN120663303A

公开日期：2025-09-19

类型：发明专利

摘要

本发明涉及人工智能技术领域，可运用于医疗健康领域和金融交易领域，公开了基于多模态预训练的动作生成方法、装置、机器人及介质，应用于智能手术机器人的高频动作生成场景中，或应用于智能客户服务与财富管理场景中，其中方法包括：获取语言指令、视觉图像和机器人本体感知数据；通过预训练视觉语言模型将语言指令、视觉图像和机器人本体感知数据进行多模态特征对齐和跨模态特征融合，生成融合后联合特征向量；通过预训练的目标动作模型采用流匹配技术基于融合后联合特征生成目标连续控制指令；基于目标连续控制指令生成机器人的连续动作。本发明提高了机器人动作生成的效率和跨平台适应性。

技术关键词

动作生成方法机器人本体多模态特征视觉感知特征语义特征生成机器人图像多层感知机数据指令智能客户服务动作生成装置语言编码器手术机器人可读存储介质人工智能技术

系统为您推荐了相关专利信息

一种六轴工业机器人与智能视觉柔化线装置

六轴工业机器人机器人本体视觉检测单元中央控制单元工作台

一种大数据人工智能监控系统

医疗数据采集模块大数据人工智能生物传感器阵列信息采集单元医疗监控技术

一种基于多模态大语言模型的疼痛等级识别方法、系统、电子设备、可读存储介质

等级识别方法大语言模型视觉特征多模态文本编码器

一种基于目标导向型的双侧上肢康复训练系统及方法

上肢康复训练系统康复机器人患者导纳控制算法助力

多屏无缝拼接的玻璃基显示光学一致性调节方法

像素点参数视觉注意力模型标记调节单元

基于多模态预训练的动作生成方法、装置、机器人及介质

站点导航

APP 下载