AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板
9840 AI技术研报
刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

全新预训练数据筛选方案,让数据效率提升10倍!配置仅需fastText评分器|港科大vivo出品

全新预训练数据筛选方案,让数据效率提升10倍!配置仅需fastText评分器|港科大vivo出品
10972 AI技术研报
全新预训练数据筛选方案,让数据效率提升10倍!配置仅需fastText评分器|港科大vivo出品

讨厌RAG生成幻觉?试一下SAT重构文本分块,按语义而不是Token

讨厌RAG生成幻觉?试一下SAT重构文本分块,按语义而不是Token
9054 AI技术研报
讨厌RAG生成幻觉?试一下SAT重构文本分块,按语义而不是Token

DanceGRPO:首个统一视觉生成的强化学习框架

DanceGRPO:首个统一视觉生成的强化学习框架
8986 AI技术研报
DanceGRPO:首个统一视觉生成的强化学习框架

Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型

Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型
7994 AI技术研报
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型

精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快
9272 AI技术研报
精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025
9365 AI技术研报
首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

ICML 2025 | 如何在合成文本数据时避免模型崩溃?

ICML 2025 | 如何在合成文本数据时避免模型崩溃?
9318 AI技术研报
ICML 2025 | 如何在合成文本数据时避免模型崩溃?

推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究

推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究
10286 AI资讯
推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究

首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源

首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源
10691 AI技术研报
首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源
上一页 当前第226页,共439页 下一页
沪ICP备2023015588号