AI资讯新闻榜单内容搜索-强化学习

AITNT
未登录
搜索: 强化学习

补齐OpenClaw进化拼图!AReaL v1.0开源,智能体强化学习「一键接入」

补齐OpenClaw进化拼图!AReaL v1.0开源,智能体强化学习「一键接入」
9441 AI技术研报
补齐OpenClaw进化拼图!AReaL v1.0开源,智能体强化学习「一键接入」

推荐系统进入「双动力」时代!首篇LLM-RL协同推荐综述深度解析

推荐系统进入「双动力」时代!首篇LLM-RL协同推荐综述深度解析
8788 AI技术研报
推荐系统进入「双动力」时代!首篇LLM-RL协同推荐综述深度解析

告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%

告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%
8105 AI技术研报
告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%

人脑细胞做成芯片打Doom!20万活体神经元自己探路杀敌,学习效率碾压深度强化学习

人脑细胞做成芯片打Doom!20万活体神经元自己探路杀敌,学习效率碾压深度强化学习
8104 AI资讯
人脑细胞做成芯片打Doom!20万活体神经元自己探路杀敌,学习效率碾压深度强化学习

ICLR 2026|在「想象」中进化的机器人:港科大×字节跳动Seed提出WMPO,在世界模型中进行VLA强化学习

ICLR 2026|在「想象」中进化的机器人:港科大×字节跳动Seed提出WMPO,在世界模型中进行VLA强化学习
7895 AI技术研报
ICLR 2026|在「想象」中进化的机器人:港科大×字节跳动Seed提出WMPO,在世界模型中进行VLA强化学习

首次证实RL能让3D模型学会推理,复杂文本描述下生成质量跃升!

首次证实RL能让3D模型学会推理,复杂文本描述下生成质量跃升!
7046 AI技术研报
首次证实RL能让3D模型学会推理,复杂文本描述下生成质量跃升!

ICLR2026 Oral | 当情感识别不再是分类题:EmotionThinker 让 SpeechLLM 学会“解释情绪”

ICLR2026 Oral | 当情感识别不再是分类题:EmotionThinker 让 SpeechLLM 学会“解释情绪”
8168 AI技术研报
ICLR2026 Oral | 当情感识别不再是分类题:EmotionThinker 让 SpeechLLM 学会“解释情绪”

5 亿 ARR的Cursor,已经没人讨论它了?

5 亿 ARR的Cursor,已经没人讨论它了?
9305 AI资讯
5 亿 ARR的Cursor,已经没人讨论它了?

情人节最硬核“Kiss”!中国AI突破300年亲吻数难题,连刷多维度纪录

情人节最硬核“Kiss”!中国AI突破300年亲吻数难题,连刷多维度纪录
7717 AI资讯
情人节最硬核“Kiss”!中国AI突破300年亲吻数难题,连刷多维度纪录

训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD
9069 AI技术研报
训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD
上一页 当前第1页,共37页 下一页
沪ICP备2023015588号