AI资讯新闻榜单内容搜索-Llama

AITNT
未登录
搜索: Llama

32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%

32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%
11208 AI技术研报
32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%

速度秒杀GPT-4o!Mistral开源首个22B代码模型破记录,支持80+编程语言

速度秒杀GPT-4o!Mistral开源首个22B代码模型破记录,支持80+编程语言
11080 AI技术研报
速度秒杀GPT-4o!Mistral开源首个22B代码模型破记录,支持80+编程语言

Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练
9887 AI技术研报
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B

马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
9065 AI技术研报
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调
9605 AI技术研报
只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

低价“杀死”大模型

低价“杀死”大模型
7458 AI资讯
低价“杀死”大模型

250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞

250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞
10865 AI技术研报
250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞

一夜掀翻 GPT-4V 的国产「小钢炮」,可能会是华为小米们对抗 AI iPhone 的关键武器

一夜掀翻 GPT-4V 的国产「小钢炮」,可能会是华为小米们对抗 AI iPhone 的关键武器
10272 AI资讯
一夜掀翻 GPT-4V 的国产「小钢炮」,可能会是华为小米们对抗 AI iPhone 的关键武器

LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究
4023 AI技术研报
LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3
11152 AI技术研报
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3
上一页 当前第26页,共41页 下一页
沪ICP备2023015588号