AI资讯新闻榜单内容搜索-算法

AITNT
未登录
搜索: 算法

超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO

超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO
6522 AI技术研报
超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO

迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单

迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单
4264 AI技术研报
迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
8247 AI技术研报
超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

又一位字节AI大将离职

又一位字节AI大将离职
6969 AI资讯
又一位字节AI大将离职

「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍

「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍
5429 AI技术研报
「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准
8629 AI技术研报
北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

重点收藏!三家众擎机器人核心供应链企业!附辟谣信息

重点收藏!三家众擎机器人核心供应链企业!附辟谣信息
10410 AI资讯
重点收藏!三家众擎机器人核心供应链企业!附辟谣信息

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
9750 AI技术研报
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

蒸馏任何深度,仅用少量无标签数据就能实现单目深度估计新SOTA

蒸馏任何深度,仅用少量无标签数据就能实现单目深度估计新SOTA
9018 AI技术研报
蒸馏任何深度,仅用少量无标签数据就能实现单目深度估计新SOTA

一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件
10243 AI技术研报
一文详解:DeepSeek 第四天开源的模型设计套件
上一页 当前第19页,共41页 下一页
沪ICP备2023015588号