智能体动作生成方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
智能体动作生成方法、装置、计算机设备及存储介质
申请号:CN202510611701
申请日期:2025-05-12
公开号:CN120542466A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及人工智能及医疗健康技术领域,公开了智能体动作生成方法、装置、计算机设备及存储介质。所述方法包括:获取环境的视觉信号以及任务指令的文本信息;将视觉信号以及文本信息输入至具身多模态智能体中进行动作生成,以得到生成结果;输出生成结果;具身多模态智能体的训练过程包括:使用大语言模型生成任务指令和专家演示数据,结合视觉信号和任务输入的文本信息,利用DAgger‑DPO算法优化具身多模态智能体的行为模仿。通过实施本发明的方法可实现结合大语言模型智能体和视觉语言模型智能体的优势,提高大语言模型;在动态视觉环境中的适应能力;与传统视觉语言模型相比,能更准确地捕捉环境信息,并实现更高效的环境交互。
技术关键词
动作生成方法 大语言模型 文本 变换器模块 计算机设备 指令 动作生成装置 医疗健康技术 交叉注意力机制 信号 视觉特征提取 算法 输入模块 模拟器 生成智能 解码器 数据 规划
系统为您推荐了相关专利信息
1
基于大语言模型的Rust语言系统安全性增强方法与装置
大语言模型 树形数据结构 语义 微处理器 可读存储介质
2
一种基于协同优化的多激光3D打印路径规划方法及系统
激光头 路径规划方法 避碰规则 系统实时监控 复杂度
3
一种针对C语言编译器优化缺陷的根因分类方法
集成学习方法 大语言模型 随机森林模型 数据验证 自动化分类方法
4
一种浏览器控制方法、装置、电子设备及介质
电子设备 浏览器控制方法 大语言模型 图片 指令
5
混合专家目标检测系统及方法
门控神经网络 解码器 融合系统 实体 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号