这是Bubble2026年的第51篇更新
Hello, 大家假期好!
从去年开始做这个账号以来,我其实写过不少测模型的文章。我相信也有很多朋友是因为看了我测评的文章关注我的。
但从过年之后,真的就很少写模型评测的文章了。
主要是我写文章的速度甚至一度跟不上模型发布的速度了。
比如上周,又是gpt image 2, 又是gpt 5.5, 又是DeepSeek V4, 这哪个单拿出来,都是炸裂级,更别说放在一周之内,这你能受的了么;
但,咱也不能不测就是说!
所以放假第一天,我就整一个活,做了个横测,看看国产的模型里,到底哪个比较实用点。
我选择的国产模型里有MiniMax, DeepSeek ,Kimi,还有小米的MiMo 的最新模型。
不为别的,就为找到最能匡匡干活的那个。
那我们废话少说,直接开始!
我是直接把这些模型都接入进了OpenCode 里。
我测试的第一个任务是把DeepSeek 最新的讲多模态的这篇论文从pdf 格式提取精华内容做成pptx格式的PPT。
靠北,为什么DeepSeek 每次都在放假的时候更新!
提示词不复杂,就是:
“把这篇论文的内容做成一个格式为PPTX 的PPT; 内容上尽可能全面; PPT样式需要设计的高级好看; ”
我们先来看下Kimi K 2.6的效果。


内容挺全面详细的,但是可以看到有文字明显重叠了,而且有的标题和正文之间的间距明显过于拥挤了。
然后是DeepSeek V4 Pro 的效果,我把推理程度开到最大进行测试。


内容总结提取的也不错。但是也是样式上,特别是文字间距控制的不是很好,而且文字和表格可以看到重位了都,强迫症看着非常难受。
再来看MiniMax M2.7 的效果,

我认为是比较好的一个效果,无论是内容提取,还是对样式排版上的设计,都是比前两个模型要好的。
最后是小米新出的MiMo V2.5 Pro的效果:

讲真,论样式,我可能会更吃小米这个。
但是很明显的问题是,它做出来的,也是出现了文字位置的重叠的问题,可读性比较差。
所以这一part 我会投票给MiniMax。
第二个任务, 是让模型自己去抓一些DeepSeek V4 相关的内容,然后写成一个word 文档。
我们先来看Kimi K 2.6的效果:

整体还是非常不错的,有表格,有字体颜色的变化,还有排版,信息也比较全面,还带了来源。
然后是DeepSeek 自己的表现:

果然,自己搜自己的表现就是不一样,内容更加详尽,样式也更好看。
但是唯一的问题是,我用的DeepSeek 是V4 Pro, 推理程度开到最高,就会导致最后生成速度变慢很多。
再来是MiniMax M2.7的表现:

MiniMax 速度是比较快的而且格式也没什么问题,但是整理的内容相比前面两个模型来说,没特别详尽。
但人家这毕竟只是个200多B的模型,参数量比其他几家小了好多倍呢是,当然会有点偷懒。
最后是MiMo的表现,

内容比较详尽,而且排版样式我觉得是这几个里和DeepSeek 的我最喜欢的。
这一part,我会把票投给MiMo 和 DeepSeek;
我测的第三个任务是结合了我一个复杂的Skill。
这个Skill 是让这几个模型生成一个HTML格式的PPT,但是里面要求模型要调用图像模型的API来进行图像的生成,还有用playwright mcp来对做好的HTML进行一页页截图存在项目中。
这个任务相比于前面两个任务是比较复杂的了。
我们还是先来看Kimi K 2.6的效果。

我后面看Agent 的thinking 过程的时候发现它在做的时候没去调用我的skill。
难怪我说这结果怎么看怎么别扭。

我发现问题在于它执行Glob的时候,没找到我的Skills...
不知道为啥别的模型都没问题,就K2.6出现了问题... 我觉得这应该不单单是模型的原因,跟这个跟Agent 框架也有很大的关系。
可能适配度没那么高。
再来看DeepSeek 的效果;

DeepSeek 在执行的整个过程是没什么问题的,包括调用API生图,然后用playwright 截图都做了。


但是它在当中第4页的时候,因为黑色背景的原因,导致部分字体和背景重了

再来看看MiniMax的效果;

整个观感都没什么问题,没有字体重叠,错位,遮挡这些问题。美感上也比其他几个模型更强。
最后是MiMo的效果:

也做的不错。
所以这一part, 我把票投给MiMo 和MiniMax。
写到这儿,我觉得可以再来盘盘几个模型的订阅方式。
DeepSeek 不用多说,没有Coding Plan,目前是只能靠API打折,和极低的缓存命中价格来提供给用户。
MiMo 有token plan,但是消耗的则快/
Kimi 提供了自己的Coding plan ,并且还有自己专属的Kimi CLI,但是速度没那么快;
MiniMax 提供的Token Plan,选择档位更多,速度也更快;而且除了用于Coding之外,还可以用于图像、视频、音乐的生成,
再结合一下,它们之前开源了他们的CLI和Skills, 这简直就是打工牛马人心中的专属牛马配置。
牛马工具就得配上牛马模型。
以前评测的时候,我们总是在问,哪个模型效果最牛逼,
但是今年以来,我看到的明显的趋势是,
算力越来越贵,coding plan 越卖越少,甚至卖到被迫下线,没法再出售的地步。。。
AI是越来越牛逼,融入了我们的生活,但是对普通用户来说,一个很现实的问题也开始出现了:
你到底能不能长期用得起。
因为 Agent 时代,模型不只是拿来聊天和跑分的,它要会调用工具,要会执行任务,要能又快又好的稳定输出。
这次测下来,我觉得MiniMax M2.7 确实是我这次觉得最全面的一个。
它不一定每一项都都是顶尖,
但它确实是一个真的能坐到工位上帮我稳定干活的模型。
文章来自于微信公众号 "BubbleBrain",作者 "BubbleBrain"
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0