AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%

只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%
9141 AI技术研报
只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能 机器之心 2025年05月02日 12:39 北京

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能 机器之心 2025年05月02日 12:39 北京
8782 AI技术研报
LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能            机器之心     2025年05月02日 12:39 北京

CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源
9021 AI技术研报
CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述

后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述
8993 AI技术研报
后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述

不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究

不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
7718 AI技术研报
不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究

400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能
8928 AI技术研报
400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙

深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
9643 AI资讯
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙

深度|AI独角兽华裔创始人:算法的一切认知都来自数据;AI可稍微自我改进,但主要进步仍来自于人

深度|AI独角兽华裔创始人:算法的一切认知都来自数据;AI可稍微自我改进,但主要进步仍来自于人
9091 AI资讯
深度|AI独角兽华裔创始人:算法的一切认知都来自数据;AI可稍微自我改进,但主要进步仍来自于人

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即
7911 AI资讯
新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍

CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍
8184 AI技术研报
CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍
上一页 当前第234页,共439页 下一页
沪ICP备2023015588号