摘要
本发明涉及机器人技术领域,公开了一种人形机器人的姿势生成方法、装置、机器人、介质及产品,方法包括:获取待输出的第一语音数据、第一特殊动作标记、高斯噪声和时间步;根据第一语音数据,确定第一梅尔频谱和第一深度语义特征,第一深度语义特征为通过自监督语音表示学习模型处理的第一语音数据;将第一梅尔频谱、第一深度语义特征、第一特殊动作标记、高斯噪声和时间步输入姿势生成模型,根据姿势生成模型的输出确定第一动作数据,姿势生成模型为完成训练的扩散模型;在输出第一语音数据时,同步控制人形机器人生成第一动作数据所表征的手势动作。本发明能够在分布内生成更多样的动作,提升人机交互的自然度和亲近感。
技术关键词
语义特征
人形机器人
语音
姿势
噪声数据
生成方法
标记
手势
样本
阶段
可读存储介质
指令
计算机程序产品
机器人技术
参数
存储器
系统为您推荐了相关专利信息
AR眼镜
医学影像数据
医学影像分析系统
自动分析方法
自动分析系统
数控机床控制器
操作界面
指令
空间坐标信息
动态
语义标签
车间设备布局
平面图
边界特征
噪声数据
情感特征
标注方法
多模态情感分析
多层次
端点检测方法