AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」

Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」
12097 AI资讯
Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」

人类遗忘的难题解法,被GPT-5重新找出来了

人类遗忘的难题解法,被GPT-5重新找出来了
7018 AI资讯
人类遗忘的难题解法,被GPT-5重新找出来了

剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了

剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了
8252 AI技术研报
剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了

拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升

拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升
8466 AI技术研报
拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升

真正的AI竞争力,藏在大模型“后训练”这一步

真正的AI竞争力,藏在大模型“后训练”这一步
8549 AI技术研报
真正的AI竞争力,藏在大模型“后训练”这一步

Being-VL的视觉BPE路线:把「看」和「说」真正统一起来

Being-VL的视觉BPE路线:把「看」和「说」真正统一起来
8176 AI技术研报
Being-VL的视觉BPE路线:把「看」和「说」真正统一起来

告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星

告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星
8717 AI技术研报
告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星

ICLR 2026惊现SAM 3,分割一切的下一步:让模型理解「概念」

ICLR 2026惊现SAM 3,分割一切的下一步:让模型理解「概念」
7397 AI技术研报
ICLR 2026惊现SAM 3,分割一切的下一步:让模型理解「概念」

Bug变奖励:AI的小失误,揭开创造力真相!

Bug变奖励:AI的小失误,揭开创造力真相!
6844 AI技术研报
Bug变奖励:AI的小失误,揭开创造力真相!

为MoE解绑:全新「专家即服务」推理架构发布,超细粒度扩展锐减37.5%成本

为MoE解绑:全新「专家即服务」推理架构发布,超细粒度扩展锐减37.5%成本
8855 AI技术研报
为MoE解绑:全新「专家即服务」推理架构发布,超细粒度扩展锐减37.5%成本
上一页 当前第108页,共432页 下一页
沪ICP备2023015588号