智能体动作生成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510611701

申请日期：2025-05-12

公开号：CN120542466A

公开日期：2025-08-26

类型：发明专利

摘要

本发明涉及人工智能及医疗健康技术领域，公开了智能体动作生成方法、装置、计算机设备及存储介质。所述方法包括：获取环境的视觉信号以及任务指令的文本信息；将视觉信号以及文本信息输入至具身多模态智能体中进行动作生成，以得到生成结果；输出生成结果；具身多模态智能体的训练过程包括：使用大语言模型生成任务指令和专家演示数据，结合视觉信号和任务输入的文本信息，利用DAgger‑DPO算法优化具身多模态智能体的行为模仿。通过实施本发明的方法可实现结合大语言模型智能体和视觉语言模型智能体的优势，提高大语言模型；在动态视觉环境中的适应能力；与传统视觉语言模型相比，能更准确地捕捉环境信息，并实现更高效的环境交互。

技术关键词

动作生成方法大语言模型文本变换器模块计算机设备指令动作生成装置医疗健康技术交叉注意力机制信号视觉特征提取算法输入模块模拟器生成智能解码器数据规划

系统为您推荐了相关专利信息

基于大语言模型的Rust语言系统安全性增强方法与装置

大语言模型树形数据结构语义微处理器可读存储介质

一种基于协同优化的多激光3D打印路径规划方法及系统

激光头路径规划方法避碰规则系统实时监控复杂度

一种针对C语言编译器优化缺陷的根因分类方法

集成学习方法大语言模型随机森林模型数据验证自动化分类方法

一种浏览器控制方法、装置、电子设备及介质

电子设备浏览器控制方法大语言模型图片指令

混合专家目标检测系统及方法

门控神经网络解码器融合系统实体编码器

智能体动作生成方法、装置、计算机设备及存储介质

站点导航

APP 下载