机器人大模型及其训练方法、装置

正文

推荐专利

机器人大模型及其训练方法、装置

申请号：CN202410823377

申请日期：2024-06-25

公开号：CN118568504A

公开日期：2024-08-30

类型：发明专利

摘要

本公开公开了机器人大模型及其训练方法、装置，涉及机器人技术领域，机器人大模型采用基于Transformer架构的深度学习技术，包含48个编码器层和48个解码器层，每个编码器层具有32个自注意力头和前馈神经网络，模型参数规模达到150亿。模型通过多层神经网络结构和自注意力机制，实现对复杂语言任务的高效处理。训练数据来源广泛，包括网页文档、新闻文章、书籍等，经过去重、噪音过滤、语言检测和数据增强等预处理步骤，确保数据质量。模型训练在高性能分布式计算平台上进行，采用Adam优化器和学习率调度策略，通过Dropout和权重衰减技术防止过拟合。模型在机器人领域有广泛应用，能够赋能机房巡检机器人、迎宾机器人和建筑机器人，实现对自然语言的深度理解。

技术关键词

前馈神经网络注意力机制解码器位置编码单元编码器机房巡检机器人分布式计算平台序列迎宾机器人建筑机器人模型训练装置神经网络结构预热策略衰减技术模型训练方法可视化工具深度学习技术退火策略

系统为您推荐了相关专利信息

一种图像识别人体姿态控制皮影的交互系统

人体姿态控制交互系统皮影装置神经网络架构图像识别算法

基于草稿模型和多数投票的低延时大模型推理方法及系统

问答模型三元组推理方法编码器文本

一种基于图像和点云特征对齐及姿态微调的车辆姿态估计方法

姿态估计方法对齐模块加权特征融合特征注意力

一种基于多层级非对称对比学习的医学图像分割方法

医学图像分割方法医学图像分割模型像素层级分支

基于热力图与批次相似性注意力约束的面部表情识别方法

面部表情识别方法面部表情识别模型热力图深度神经网络样本

机器人大模型及其训练方法、装置

站点导航

APP 下载