AI技术研报-这里有最前沿的人工智能技术解读

搜索
AI-TNT

只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%

只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%
7218 AI技术研报
只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%

68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩

68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩
6965 AI技术研报
68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩

被Transformer光芒掩盖的论文,Meta科学家回顾十年前创新之作

被Transformer光芒掩盖的论文,Meta科学家回顾十年前创新之作
7472 AI技术研报
被Transformer光芒掩盖的论文,Meta科学家回顾十年前创新之作

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能 机器之心 2025年05月02日 12:39 北京

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能 机器之心 2025年05月02日 12:39 北京
7155 AI技术研报
LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能            机器之心     2025年05月02日 12:39 北京

CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源
6774 AI技术研报
CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述

后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述
7361 AI技术研报
后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述

不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究

不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
6753 AI技术研报
不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究

Windsurf团队关于Agent的认知,相当精彩

Windsurf团队关于Agent的认知,相当精彩
8198 AI技术研报
Windsurf团队关于Agent的认知,相当精彩

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
7850 AI技术研报
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能
6726 AI技术研报
400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能
上一页 当前第61页,共385页 下一页
沪ICP备2023015588号