AI技术研报-这里有最前沿的人工智能技术解读

搜索
AI-TNT

「Next-Token」范式改变!刚刚,强化学习预训练来了

「Next-Token」范式改变!刚刚,强化学习预训练来了
5177 AI技术研报
「Next-Token」范式改变!刚刚,强化学习预训练来了

103K「硬核」题,让大模型突破数学推理瓶颈

103K「硬核」题,让大模型突破数学推理瓶颈
8161 AI技术研报
103K「硬核」题,让大模型突破数学推理瓶颈

英伟达港大联手革新视觉注意力机制!GSPN高分辨率生成加速超84倍

英伟达港大联手革新视觉注意力机制!GSPN高分辨率生成加速超84倍
7490 AI技术研报
英伟达港大联手革新视觉注意力机制!GSPN高分辨率生成加速超84倍

10%训练数据超越100%表现,机器人学习领域迎来重要突破

10%训练数据超越100%表现,机器人学习领域迎来重要突破
9222 AI技术研报
10%训练数据超越100%表现,机器人学习领域迎来重要突破

揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路

揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路
5415 AI技术研报
揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路

刚刚,OpenAI最强推理模型o3-pro诞生!碾压Gemini 2.5 Pro击穿底价

刚刚,OpenAI最强推理模型o3-pro诞生!碾压Gemini 2.5 Pro击穿底价
6376 AI技术研报
刚刚,OpenAI最强推理模型o3-pro诞生!碾压Gemini 2.5 Pro击穿底价

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密
6279 AI技术研报
OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等

一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等
6115 AI技术研报
一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等

14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打
9044 AI技术研报
14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8

时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8
7029 AI技术研报
时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8
上一页 当前第21页,共385页 下一页
沪ICP备2023015588号