AI资讯新闻榜单内容搜索-强化学习

搜索
AI-TNT
搜索: 强化学习

3D打印新突破!曼大等提出DQN多样化图形路径规划器:锐角转弯降低超93%,热变形减少25%

3D打印新突破!曼大等提出DQN多样化图形路径规划器:锐角转弯降低超93%,热变形减少25%
7769 AI技术研报
3D打印新突破!曼大等提出DQN多样化图形路径规划器:锐角转弯降低超93%,热变形减少25%

完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%
9855 AI技术研报
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案

GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案
7389 AI技术研报
GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案

强化学习让大模型自动纠错,数学、编程性能暴涨,DeepMind新作

强化学习让大模型自动纠错,数学、编程性能暴涨,DeepMind新作
6337 AI技术研报
强化学习让大模型自动纠错,数学、编程性能暴涨,DeepMind新作

强化学习,正在引领AI跨越LLM之谷

强化学习,正在引领AI跨越LLM之谷
3225 AI资讯
强化学习,正在引领AI跨越LLM之谷

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式
6552 AI技术研报
北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

张俊林:OpenAI o1的价值意义及强化学习的Scaling Law

张俊林:OpenAI o1的价值意义及强化学习的Scaling Law
5593 AI资讯
张俊林:OpenAI o1的价值意义及强化学习的Scaling Law

刚刚,OpenAI震撼发布o1大模型,强化学习突破LLM推理极限

刚刚,OpenAI震撼发布o1大模型,强化学习突破LLM推理极限
4896 AI资讯
刚刚,OpenAI震撼发布o1大模型,强化学习突破LLM推理极限

清华、北大等发布Self-Play强化学习最新综述

清华、北大等发布Self-Play强化学习最新综述
7749 AI技术研报
清华、北大等发布Self-Play强化学习最新综述

北大领衔,多智能体强化学习研究登上Nature子刊

北大领衔,多智能体强化学习研究登上Nature子刊
7575 AI技术研报
北大领衔,多智能体强化学习研究登上Nature子刊
上一页 当前第19页,共23页 下一页
沪ICP备2023015588号