AI资讯新闻榜单内容搜索-大模型

AITNT
搜索: 大模型

HumanSense:探索多模态推理边界,打造「察言观色会共情」的全模态交互伙伴

HumanSense:探索多模态推理边界,打造「察言观色会共情」的全模态交互伙伴
7170 AI技术研报
HumanSense:探索多模态推理边界,打造「察言观色会共情」的全模态交互伙伴

不用强化学习也能推理,哈佛新采样算法竟能让基础模型比肩GRPO后训练版本

不用强化学习也能推理,哈佛新采样算法竟能让基础模型比肩GRPO后训练版本
5236 AI技术研报
不用强化学习也能推理,哈佛新采样算法竟能让基础模型比肩GRPO后训练版本

大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解

大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解
7484 AI技术研报
大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国
8660 AI资讯
现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘

大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
5923 AI技术研报
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘

医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!
8288 AI资讯
医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能
9743 AI技术研报
智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

X上63万人围观的Traning-Free GRPO:把GRPO搬进上下文空间学习

X上63万人围观的Traning-Free GRPO:把GRPO搬进上下文空间学习
6430 AI技术研报
X上63万人围观的Traning-Free GRPO:把GRPO搬进上下文空间学习

如果中国大模型不再开源

如果中国大模型不再开源
7810 AI资讯
如果中国大模型不再开源

长序列推理不再卡顿!北大华为KV缓存管理框架实现4.7倍推理加速

长序列推理不再卡顿!北大华为KV缓存管理框架实现4.7倍推理加速
6598 AI技术研报
长序列推理不再卡顿!北大华为KV缓存管理框架实现4.7倍推理加速
上一页 当前第16页,共467页 下一页
沪ICP备2023015588号