AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%
10036 AI技术研报
自动学会工具解题,RL扩展催化奥数能力激增17%

LLM如何高效理解用户?淘天发布首个基于用户表征的问答基准UQABench

LLM如何高效理解用户?淘天发布首个基于用户表征的问答基准UQABench
3121 AI技术研报
LLM如何高效理解用户?淘天发布首个基于用户表征的问答基准UQABench

在GSM8K上比GRPO快8倍!厦大提出CPPO,让强化学习快如闪电

在GSM8K上比GRPO快8倍!厦大提出CPPO,让强化学习快如闪电
7626 AI技术研报
在GSM8K上比GRPO快8倍!厦大提出CPPO,让强化学习快如闪电

ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识

ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识
5476 AI技术研报
ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识

这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅

这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅
11952 AI技术研报
这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅

朱啸虎:所有的AI应用都是套壳,创业公司不要浪费一分钱去训练底层模型

朱啸虎:所有的AI应用都是套壳,创业公司不要浪费一分钱去训练底层模型
9101 AI资讯
朱啸虎:所有的AI应用都是套壳,创业公司不要浪费一分钱去训练底层模型

一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成
10019 AI技术研报
一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈
6118 AI技术研报
清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失

中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失
3832 AI技术研报
中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失

200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba
11469 AI技术研报
200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba
上一页 当前第253页,共439页 下一页
沪ICP备2023015588号