AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

1毛钱1百万token,写2遍红楼梦!国产大模型下一步还想卷什么?

1毛钱1百万token,写2遍红楼梦!国产大模型下一步还想卷什么?
10566 AI资讯
1毛钱1百万token,写2遍红楼梦!国产大模型下一步还想卷什么?

KAN会引起大模型的范式转变吗?

KAN会引起大模型的范式转变吗?
11179 AI技术研报
KAN会引起大模型的范式转变吗?

CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院

CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
10037 AI技术研报
CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院

腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题

腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题
8947 AI技术研报
腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题

硅谷团队抄袭清华系大模型?面壁智能李大海独家回应:套壳现象难规避

硅谷团队抄袭清华系大模型?面壁智能李大海独家回应:套壳现象难规避
10542 AI资讯
硅谷团队抄袭清华系大模型?面壁智能李大海独家回应:套壳现象难规避

AI训练数据的版权保护:公地的悲剧还是合作的繁荣?

AI训练数据的版权保护:公地的悲剧还是合作的繁荣?
9813 AI技术研报
AI训练数据的版权保护:公地的悲剧还是合作的繁荣?

单个4090可推理,2000亿稀疏大模型「天工MoE」开源

单个4090可推理,2000亿稀疏大模型「天工MoE」开源
10300 AI技术研报
单个4090可推理,2000亿稀疏大模型「天工MoE」开源

Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集

Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集
10193 AI技术研报
Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集

再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升

再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升
10016 AI技术研报
再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升

新架构Mamba更新二代!作者:别争了,数学上Transformer和SSM是一回事

新架构Mamba更新二代!作者:别争了,数学上Transformer和SSM是一回事
11741 AI技术研报
新架构Mamba更新二代!作者:别争了,数学上Transformer和SSM是一回事
上一页 当前第402页,共451页 下一页
沪ICP备2023015588号