机器人大模型及其训练方法、装置

AITNT
正文
推荐专利
机器人大模型及其训练方法、装置
申请号:CN202410823377
申请日期:2024-06-25
公开号:CN118568504A
公开日期:2024-08-30
类型:发明专利
摘要
本公开公开了机器人大模型及其训练方法、装置,涉及机器人技术领域,机器人大模型采用基于Transformer架构的深度学习技术,包含48个编码器层和48个解码器层,每个编码器层具有32个自注意力头和前馈神经网络,模型参数规模达到150亿。模型通过多层神经网络结构和自注意力机制,实现对复杂语言任务的高效处理。训练数据来源广泛,包括网页文档、新闻文章、书籍等,经过去重、噪音过滤、语言检测和数据增强等预处理步骤,确保数据质量。模型训练在高性能分布式计算平台上进行,采用Adam优化器和学习率调度策略,通过Dropout和权重衰减技术防止过拟合。模型在机器人领域有广泛应用,能够赋能机房巡检机器人、迎宾机器人和建筑机器人,实现对自然语言的深度理解。
技术关键词
前馈神经网络 注意力机制 解码器 位置编码单元 编码器 机房巡检机器人 分布式计算平台 序列 迎宾机器人 建筑机器人 模型训练装置 神经网络结构 预热策略 衰减技术 模型训练方法 可视化工具 深度学习技术 退火策略
系统为您推荐了相关专利信息
1
一种图像识别人体姿态控制皮影的交互系统
人体姿态控制 交互系统 皮影装置 神经网络架构 图像识别算法
2
基于草稿模型和多数投票的低延时大模型推理方法及系统
问答模型 三元组 推理方法 编码器 文本
3
一种基于图像和点云特征对齐及姿态微调的车辆姿态估计方法
姿态估计方法 对齐模块 加权特征 融合特征 注意力
4
一种基于多层级非对称对比学习的医学图像分割方法
医学图像分割方法 医学图像分割模型 像素 层级 分支
5
基于热力图与批次相似性注意力约束的面部表情识别方法
面部表情识别方法 面部表情识别模型 热力图 深度神经网络 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号