AI技术研报-这里有最前沿的人工智能技术解读

AITNT

不用强化学习也能推理,哈佛新采样算法竟能让基础模型比肩GRPO后训练版本

不用强化学习也能推理,哈佛新采样算法竟能让基础模型比肩GRPO后训练版本
5239 AI技术研报
不用强化学习也能推理,哈佛新采样算法竟能让基础模型比肩GRPO后训练版本

Meta「透视」AI思维链:CRV推理诊断,准确率达 92%!

Meta「透视」AI思维链:CRV推理诊断,准确率达 92%!
8900 AI技术研报
Meta「透视」AI思维链:CRV推理诊断,准确率达 92%!

大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解

大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解
7487 AI技术研报
大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解

R-HORIZON:长程推理时代来临,复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

R-HORIZON:长程推理时代来临,复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式
7226 AI技术研报
R-HORIZON:长程推理时代来临,复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

告别黑箱解释!首个潜变量自动解释框架 | CIKM'25

告别黑箱解释!首个潜变量自动解释框架 | CIKM'25
6447 AI技术研报
告别黑箱解释!首个潜变量自动解释框架 | CIKM'25

搜索智能体的关键一课:先立目标,再照镜子

搜索智能体的关键一课:先立目标,再照镜子
7674 AI技术研报
搜索智能体的关键一课:先立目标,再照镜子

大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘

大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
5926 AI技术研报
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘

无VAE扩散模型! 清华&可灵团队「撞车」谢赛宁团队「RAE」

无VAE扩散模型! 清华&可灵团队「撞车」谢赛宁团队「RAE」
6009 AI技术研报
无VAE扩散模型! 清华&可灵团队「撞车」谢赛宁团队「RAE」

Nature点赞!哈佛MIT最新作:AI科学家时代来了

Nature点赞!哈佛MIT最新作:AI科学家时代来了
9250 AI技术研报
Nature点赞!哈佛MIT最新作:AI科学家时代来了

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能
9749 AI技术研报
智源开源EditScore:为图像编辑解锁在线强化学习的无限可能
上一页 当前第40页,共507页 下一页
沪ICP备2023015588号