AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

LLaVA-OneVision-1.5全流程开源,8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5全流程开源,8B模型预训练只需4天、1.6万美元
9674 AI技术研报
LLaVA-OneVision-1.5全流程开源,8B模型预训练只需4天、1.6万美元

只需1/4预算,性能反超基线:阿里高德提出Tree-GRPO,高效破解智能体RL难题

只需1/4预算,性能反超基线:阿里高德提出Tree-GRPO,高效破解智能体RL难题
8637 AI技术研报
只需1/4预算,性能反超基线:阿里高德提出Tree-GRPO,高效破解智能体RL难题

别被提示词优化困住!用DSPy.GEPA把Prompt做成可演进的工程(万字长文)

别被提示词优化困住!用DSPy.GEPA把Prompt做成可演进的工程(万字长文)
8869 AI技术研报
别被提示词优化困住!用DSPy.GEPA把Prompt做成可演进的工程(万字长文)

推理速度10倍提升,蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

推理速度10倍提升,蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
6328 AI技术研报
推理速度10倍提升,蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

谢赛宁新作:VAE退役,RAE当立

谢赛宁新作:VAE退役,RAE当立
8399 AI技术研报
谢赛宁新作:VAE退役,RAE当立

Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」

Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」
12097 AI资讯
Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」

人类遗忘的难题解法,被GPT-5重新找出来了

人类遗忘的难题解法,被GPT-5重新找出来了
7018 AI资讯
人类遗忘的难题解法,被GPT-5重新找出来了

剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了

剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了
8252 AI技术研报
剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了

拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升

拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升
8466 AI技术研报
拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升

真正的AI竞争力,藏在大模型“后训练”这一步

真正的AI竞争力,藏在大模型“后训练”这一步
8549 AI技术研报
真正的AI竞争力,藏在大模型“后训练”这一步
上一页 当前第107页,共432页 下一页
沪ICP备2023015588号