AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024

即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024
10203 AI技术研报
即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍
8910 AI技术研报
Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它

不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它
7200 AI技术研报
不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它

物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野

物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野
9957 AI技术研报
物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野

对话田渊栋:Scaling law代表一个非常悲观的未来

对话田渊栋:Scaling law代表一个非常悲观的未来
8618 AI资讯
对话田渊栋:Scaling law代表一个非常悲观的未来

ICML2024高分!魔改注意力,让小模型能打两倍大的模型

ICML2024高分!魔改注意力,让小模型能打两倍大的模型
9986 AI技术研报
ICML2024高分!魔改注意力,让小模型能打两倍大的模型

next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+

next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+
9707 AI技术研报
next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+

LLM的「母语」是什么?

LLM的「母语」是什么?
10371 AI技术研报
LLM的「母语」是什么?

老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题
9926 AI技术研报
老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

他们在印度村镇训练AI

他们在印度村镇训练AI
6230 AI资讯
他们在印度村镇训练AI
上一页 当前第403页,共451页 下一页
沪ICP备2023015588号