AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

里程碑时刻!100B扩散语言模型跑出892 Tokens /秒,AI的另一条路走通了

里程碑时刻!100B扩散语言模型跑出892 Tokens /秒,AI的另一条路走通了
9092 AI技术研报
里程碑时刻!100B扩散语言模型跑出892 Tokens /秒,AI的另一条路走通了

硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law

硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law
10571 AI技术研报
硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law

RLinf-USER重磅发布!别再用仿真了,真实世界训练也能「极致效率与系统化」

RLinf-USER重磅发布!别再用仿真了,真实世界训练也能「极致效率与系统化」
9052 AI技术研报
RLinf-USER重磅发布!别再用仿真了,真实世界训练也能「极致效率与系统化」

清华联手千问重塑归一化范式,让 Transformer 回归「深度」学习

清华联手千问重塑归一化范式,让 Transformer 回归「深度」学习
5863 AI技术研报
清华联手千问重塑归一化范式,让 Transformer 回归「深度」学习

ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐

ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐
7370 AI技术研报
ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐

ICLR 2026 | 在Moltbook之外,上交大联合上海AI Lab模拟了AI原⽣社交的「真实暗⾯」

ICLR 2026 | 在Moltbook之外,上交大联合上海AI Lab模拟了AI原⽣社交的「真实暗⾯」
9974 AI技术研报
ICLR 2026 | 在Moltbook之外,上交大联合上海AI Lab模拟了AI原⽣社交的「真实暗⾯」

小众架构赢麻了!通过编辑功能 LLaDA2.1 让100B扩散模型飙出892 tokens/秒的速度!

小众架构赢麻了!通过编辑功能 LLaDA2.1 让100B扩散模型飙出892 tokens/秒的速度!
10529 AI资讯
小众架构赢麻了!通过编辑功能 LLaDA2.1 让100B扩散模型飙出892 tokens/秒的速度!

训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD
9523 AI技术研报
训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

2026开年关键词:Self-Distillation,大模型真正走向「持续学习」

2026开年关键词:Self-Distillation,大模型真正走向「持续学习」
6641 AI技术研报
2026开年关键词:Self-Distillation,大模型真正走向「持续学习」

破解机器人「慢半拍」难题:南洋理工解决VLA致命短板,动态世界断层领先

破解机器人「慢半拍」难题:南洋理工解决VLA致命短板,动态世界断层领先
10261 AI技术研报
破解机器人「慢半拍」难题:南洋理工解决VLA致命短板,动态世界断层领先
上一页 当前第19页,共427页 下一页
沪ICP备2023015588号