摘要
一些实施方式涉及用于使模拟角色交互适配不同形态和交互场景的方法、系统和计算机可读介质。该系统访问表示虚拟环境中的模拟角色的运动的控制策略的图。该图通过图神经网络进行编码和处理,以生成该图的潜在嵌入。根据潜在嵌入确定定长潜在向量。该向量被输入到前馈神经网络,生成角色的动作的控制信号。通过强化学习循环,通过基于经由奖励函数评估模拟角色的动作迭代地调整该图,不断完善角色的动作,使控制策略适配不同角色形态和/或交互场景。
技术关键词
前馈神经网络
控制策略
节点
多层感知器
编码
形态
动态更新
身体
运动
关节
末端执行器
信号
处理器
注意力
场景
指令
速度
关系
计算机