摘要
本公开涉及用于交通模拟的强化学习。在各种示例中,可以基于使用人类反馈生成和/或更新包括一个或更多个交通场景的交通模型。可以提供人类反馈,指示对各种交通场景的偏好,以确定模型中的哪些场景更为真实。奖励模型可以捕获偏好信息并对一个或更多个交通场景的真实性进行排名。
技术关键词
交通
场景
自主车辆
可读存储介质
情景
对话式人工智能
计算机系统
应用程序编程接口
虚拟现实内容
网络托管
协作内容
人类
感知系统
处理器
数字孪生
数据中心
序列
系统为您推荐了相关专利信息
风险监测方法
风险评估值
项目
可读存储介质
数值
智能照明控制方法
助航灯光系统
距离信息
计算机可读指令
飞机
设备运行状态信息
机器学习模型
数字孪生技术
仿真模型
自然语言信息