AI资讯新闻榜单内容搜索-训练
站点导航
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI 源力市场
AI专利库
AI需求对接
AI新闻日报
APP 下载
iOS 下载
安卓下载
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
清空
确定
下载 APP
下载 AITNT APP
🍎 iOS 下载
🤖 Android 下载
验证码登录
×
发送
登录即代表您已同意AITNT
用户协议
和
隐私政策
登录
登录成功后会自动刷新界面
搜索: 训练
豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性
豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性
11425
AI技术研报
Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解
Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解
5343
AI技术研报
OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑
OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑
7570
AI资讯
MSRA:视觉生成六大技术问题
MSRA:视觉生成六大技术问题
11050
AI技术研报
OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级
OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级
10091
AI资讯
ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率
ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率
11354
AI技术研报
五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活
五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活
10236
AI资讯
生成式模型不只会「模仿」!哈佛、UCSB等最新成果:性能可超越训练集专家水平
生成式模型不只会「模仿」!哈佛、UCSB等最新成果:性能可超越训练集专家水平
10559
AI技术研报
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
10503
AI技术研报
H100利用率飙升至75%!英伟达亲自下场FlashAttention三代升级,比标准注意力快16倍
H100利用率飙升至75%!英伟达亲自下场FlashAttention三代升级,比标准注意力快16倍
10598
AI资讯
上一页
当前第388页,共451页
下一页
沪ICP备2023015588号