AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%

大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%
7694 AI技术研报
大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%

坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!

坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!
7460 AI资讯
坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!

打破推荐系统「信息孤岛」!中科大与华为提出首个生成式多阶段统一框架,性能全面超越 SOTA

打破推荐系统「信息孤岛」!中科大与华为提出首个生成式多阶段统一框架,性能全面超越 SOTA
7008 AI技术研报
打破推荐系统「信息孤岛」!中科大与华为提出首个生成式多阶段统一框架,性能全面超越 SOTA

国产SOTA新模型精准get“画(3+6)条命的动物” | 开源

国产SOTA新模型精准get“画(3+6)条命的动物” | 开源
8615 AI技术研报
国产SOTA新模型精准get“画(3+6)条命的动物” | 开源

人人皆可创作音乐!腾讯AI Lab开源音乐生成大模型SongGeneration

人人皆可创作音乐!腾讯AI Lab开源音乐生成大模型SongGeneration
10161 AI技术研报
人人皆可创作音乐!腾讯AI Lab开源音乐生成大模型SongGeneration

李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件

李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件
10516 AI技术研报
李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件

首个「万亿级时间点」预训练,清华发布生成式时序大模型日晷 | ICML Oral

首个「万亿级时间点」预训练,清华发布生成式时序大模型日晷 | ICML Oral
10098 AI资讯
首个「万亿级时间点」预训练,清华发布生成式时序大模型日晷 | ICML Oral

Agent全自动搭建代码运行环境,实时更新解决评测过拟合/数据污染问题|微软

Agent全自动搭建代码运行环境,实时更新解决评测过拟合/数据污染问题|微软
9033 AI技术研报
Agent全自动搭建代码运行环境,实时更新解决评测过拟合/数据污染问题|微软

推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本

推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本
9748 AI技术研报
推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究
9147 AI技术研报
DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究
上一页 当前第194页,共437页 下一页
沪ICP备2023015588号