AI技术研报-这里有最前沿的人工智能技术解读

AITNT

DeepSeek加持,北大通院几何模型达IMO金牌水平!32个CPU核心和1块4090就能实现满血解题

DeepSeek加持,北大通院几何模型达IMO金牌水平!32个CPU核心和1块4090就能实现满血解题
9787 AI技术研报
DeepSeek加持,北大通院几何模型达IMO金牌水平!32个CPU核心和1块4090就能实现满血解题

DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升

DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升
5600 AI技术研报
DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升

超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分
7797 AI技术研报
超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为

攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为
7292 AI技术研报
攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞
8178 AI技术研报
LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞

AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零

AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
10166 AI技术研报
AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零

Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布

Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布
8296 AI技术研报
Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3
8573 AI技术研报
语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

从模糊到具体:高效使用DeepSeek-R1等推理型模型的前置步骤

从模糊到具体:高效使用DeepSeek-R1等推理型模型的前置步骤
11087 AI技术研报
从模糊到具体:高效使用DeepSeek-R1等推理型模型的前置步骤

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
6087 AI技术研报
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
上一页 当前第298页,共551页 下一页
沪ICP备2023015588号