AI资讯新闻榜单内容搜索-训练

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

谷歌:假如AI大模型支持无限长上下文,会如何?

谷歌:假如AI大模型支持无限长上下文,会如何?
9736 AI资讯
谷歌:假如AI大模型支持无限长上下文,会如何?

谷歌爆改Transformer,“无限注意力”让1B小模型读完10部小说,114倍信息压缩

谷歌爆改Transformer,“无限注意力”让1B小模型读完10部小说,114倍信息压缩
9794 AI资讯
谷歌爆改Transformer,“无限注意力”让1B小模型读完10部小说,114倍信息压缩

魔改RNN挑战Transformer,RWKV上新:推出2种新架构模型

魔改RNN挑战Transformer,RWKV上新:推出2种新架构模型
9416 AI资讯
魔改RNN挑战Transformer,RWKV上新:推出2种新架构模型

改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果
11585 AI技术研报
改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争
10585 AI技术研报
直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

MIT等首次深度研究「集成LLM」预测能力:可媲美人类群体准确率

MIT等首次深度研究「集成LLM」预测能力:可媲美人类群体准确率
7048 AI资讯
MIT等首次深度研究「集成LLM」预测能力:可媲美人类群体准确率

「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线

「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
6316 AI资讯
「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线

稀疏算力暴涨591%,Meta推出5nm AI训练芯片,自研AI芯片盛世来了

稀疏算力暴涨591%,Meta推出5nm AI训练芯片,自研AI芯片盛世来了
8373 AI资讯
稀疏算力暴涨591%,Meta推出5nm AI训练芯片,自研AI芯片盛世来了

Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升

Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升
5835 AI资讯
Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
7276 AI资讯
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
上一页 当前第419页,共452页 下一页
沪ICP备2023015588号