AI资讯新闻榜单内容搜索-训练

AITNT
搜索: 训练

ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」
6837 AI技术研报
ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」

千星项目LLMRouter:多模型路由,16+策略优化推理

千星项目LLMRouter:多模型路由,16+策略优化推理
8742 AI技术研报
千星项目LLMRouter:多模型路由,16+策略优化推理

9B端侧开源模型跑通百万上下文,面壁全新稀疏-线性混合注意力架构SALA立功了!

9B端侧开源模型跑通百万上下文,面壁全新稀疏-线性混合注意力架构SALA立功了!
9451 AI技术研报
9B端侧开源模型跑通百万上下文,面壁全新稀疏-线性混合注意力架构SALA立功了!

这个AI炒股年化收益27.75%!用自进化Agent挖掘穿越牛熊的量化因子

这个AI炒股年化收益27.75%!用自进化Agent挖掘穿越牛熊的量化因子
9475 AI技术研报
这个AI炒股年化收益27.75%!用自进化Agent挖掘穿越牛熊的量化因子

里程碑时刻!100B扩散语言模型跑出892 Tokens /秒,AI的另一条路走通了

里程碑时刻!100B扩散语言模型跑出892 Tokens /秒,AI的另一条路走通了
8412 AI技术研报
里程碑时刻!100B扩散语言模型跑出892 Tokens /秒,AI的另一条路走通了

硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law

硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law
9825 AI技术研报
硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law

RLinf-USER重磅发布!别再用仿真了,真实世界训练也能「极致效率与系统化」

RLinf-USER重磅发布!别再用仿真了,真实世界训练也能「极致效率与系统化」
8273 AI技术研报
RLinf-USER重磅发布!别再用仿真了,真实世界训练也能「极致效率与系统化」

清华联手千问重塑归一化范式,让 Transformer 回归「深度」学习

清华联手千问重塑归一化范式,让 Transformer 回归「深度」学习
5138 AI技术研报
清华联手千问重塑归一化范式,让 Transformer 回归「深度」学习

ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐

ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐
6503 AI技术研报
ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐

ICLR 2026 | 在Moltbook之外,上交大联合上海AI Lab模拟了AI原⽣社交的「真实暗⾯」

ICLR 2026 | 在Moltbook之外,上交大联合上海AI Lab模拟了AI原⽣社交的「真实暗⾯」
9236 AI技术研报
ICLR 2026 | 在Moltbook之外,上交大联合上海AI Lab模拟了AI原⽣社交的「真实暗⾯」
上一页 当前第1页,共410页 下一页
沪ICP备2023015588号