Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行

搜索
AI-TNT
正文
资源拓展
Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行
2025-08-01 12:32

开源编程模型的天花板,要被Qwen3-Coder掀翻了。


今天凌晨,Qwen3-Coder-Flash也重磅开源!


Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行


“甜品级”的size,但完全“大餐”级的性能。


  • 多编程任务超越顶级开源模型,仅略逊于闭源的Claude Sonnet-4、GPT-4.1等。


  • 原生上下文窗口支持256k token,可延长拓展至1 million token。


  • 33GB内存(即中端笔记本)可运行。


啥概念?


相当于GPT-4.1级别的能力,还能让你本地使用!


Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行


有人实测,在苹果M4 Max上通过mlx-lm运行Qwen3-Coder-Flash,每秒可生成4467个token,相当快。


Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行


还有人已经火速推出了量化版本,显存不够的童鞋可以来下载使用。


Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行


林俊旸也发推表示,这是一个绿色低碳极速版coding模型。


我想这将是本地编程的最好选择。


Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行


笔记本上就能跑出好效果


Qwen3-Coder-Flash是Qwen3-Coder的精简版,都是非推理模型。


  • 采用MoE架构,30亿参数总量,激活参数3.3亿。


  • 原生上下文窗口支持256k token,通过YaRN等可延长至一百万token上下文,适合大型代码库和复杂多文件工程。


  • 针对Qwen Code、Cline、Roo Code、Kilo Code等平台进行优化。


  • 无缝支持函数调用和agent工作流。


主要强调了Agent方面的能力:


  • Agentic Coding(智能体编程)


  • Agentic Browser Use(智能体浏览器使用)


  • Agentic Tool Use(智能体工具调用)


有博主在M2 Macbook Pro上用量化版Qwen3-Coder-Flash( 24.82GB 6bit MLX版)做的游戏,运行效果很不错。


Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行


而且提示词也很短,就一句话:


Write an HTML and JavaScript page implementing space invaders.


这意味着训练数据中可能存在大量相关或者类似任务,才能让模型一次就能输出非常好的效果。


博主在首次尝试后,感觉飞船发射的子弹太快了,所以想要让它降速一点。


由于他使用的Open WebUI没有类似于Claude Artifacts的工具调用的功能,这意味着模型需要重新输出一个完整结果,实测表明它确实可以做到。


此外他还实测了生成鹈鹕骑自行车,每秒60个tokens,不过效果有点问题。


Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行


但u1s1,最近Qwen的开源节奏实在是太快了,更新模型一箩筐:


  • Qwen3-Embedding


  • Qwen-Vlo


  • Qwen-TTS


  • Qwen3-235B-A22B


  • Qwen3-Coder


  • Qwen-MT


  • Qwen3-235B-A22B-Thinking-2507


  • Qwen3-30B-A3B-Instruct-2507


  • ……


而且都开源了,还提出了很多小显存友好的方案。


开源之光的title在国产模型这里竞争格外激烈啊(doge)


Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行


最后,Qwen3-Coder-Flash体验方式如下,感兴趣的同学快去体验吧!


QwenChat:chat.qwen.ai


魔搭社区:https://www.modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct


HF:https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct


文章来自于微信公众号“量子位”,作者是“明敏”。


1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

5
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales

添加客服微信openai178,进AITNT官方交流群
IOS下载
安卓下载
微信群
沪ICP备2023015588号