AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

One RL to See Them All?一个强化学习统一视觉-语言任务!

One RL to See Them All?一个强化学习统一视觉-语言任务!
10056 AI技术研报
One RL to See Them All?一个强化学习统一视觉-语言任务!

阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜

阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜
8213 AI技术研报
阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜

让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力
10863 AI技术研报
让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

扩散语言模型九倍推理加速!上海交大:KV Cache并非自回归模型的专属技巧

扩散语言模型九倍推理加速!上海交大:KV Cache并非自回归模型的专属技巧
11241 AI技术研报
扩散语言模型九倍推理加速!上海交大:KV Cache并非自回归模型的专属技巧

北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强
10167 AI技术研报
北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

与Gemini Diffusion共振!首个扩散式「发散思维链」来了

与Gemini Diffusion共振!首个扩散式「发散思维链」来了
8117 AI技术研报
与Gemini Diffusion共振!首个扩散式「发散思维链」来了

5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限

5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限
9601 AI资讯
5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限

99%的人都理解错了,AI Agent ≠ Agentic AI,康奈尔大学发33页论文澄清关键区别。

99%的人都理解错了,AI Agent ≠ Agentic AI,康奈尔大学发33页论文澄清关键区别。
7792 AI技术研报
99%的人都理解错了,AI Agent ≠ Agentic AI,康奈尔大学发33页论文澄清关键区别。

这样更公平:用jina-reranker-m0为多模态文档打分重排

这样更公平:用jina-reranker-m0为多模态文档打分重排
8806 AI技术研报
这样更公平:用jina-reranker-m0为多模态文档打分重排

刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿

刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿
10175 AI资讯
刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿
上一页 当前第218页,共438页 下一页
沪ICP备2023015588号