AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

武大等发布大型视觉语言模型最新安全综述:全面分类攻击策略、防御机制和评估方法

武大等发布大型视觉语言模型最新安全综述:全面分类攻击策略、防御机制和评估方法
8327 AI技术研报
武大等发布大型视觉语言模型最新安全综述:全面分类攻击策略、防御机制和评估方法

可自定义的推理框架SoT-Agent,通过小路由模型自适应推理,更灵活,更经济 | 最新

可自定义的推理框架SoT-Agent,通过小路由模型自适应推理,更灵活,更经济 | 最新
7774 AI技术研报
可自定义的推理框架SoT-Agent,通过小路由模型自适应推理,更灵活,更经济 | 最新

ICLR 2025 | 原生3D+流匹配,现有SOTA被GaussianAnything超越

ICLR 2025 | 原生3D+流匹配,现有SOTA被GaussianAnything超越
9157 AI技术研报
ICLR 2025 | 原生3D+流匹配,现有SOTA被GaussianAnything超越

「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍

「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍
5755 AI技术研报
「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效
6359 AI技术研报
优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源

已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源
8374 AI技术研报
已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源

富士康开发出台湾首个推理大模型FoxBrain,性能落后于DeepSeek

富士康开发出台湾首个推理大模型FoxBrain,性能落后于DeepSeek
10949 AI资讯
富士康开发出台湾首个推理大模型FoxBrain,性能落后于DeepSeek

草稿链代替思维链,推理token砍掉80%,显著降低算力成本和延迟

草稿链代替思维链,推理token砍掉80%,显著降低算力成本和延迟
8563 AI技术研报
草稿链代替思维链,推理token砍掉80%,显著降低算力成本和延迟

杨立昆最新访谈:用于训练AI模型的资源,远没有到尽头

杨立昆最新访谈:用于训练AI模型的资源,远没有到尽头
7660 AI资讯
杨立昆最新访谈:用于训练AI模型的资源,远没有到尽头

10²⁶参数,AGI还需70年!清华人大预测届时GPU总价达4000万倍苹果市值

10²⁶参数,AGI还需70年!清华人大预测届时GPU总价达4000万倍苹果市值
10590 AI技术研报
10²⁶参数,AGI还需70年!清华人大预测届时GPU总价达4000万倍苹果市值
上一页 当前第271页,共444页 下一页
沪ICP备2023015588号