Midjourney 今天凌晨突然在 Alpha 平台上线 V8 模型测试版,速度暴涨5倍,支持原生2K分辨率,文本渲染大幅改进。官方推文12小时内狂揽131万浏览。但有用户花6小时测试后发现:RAW模式翻车,抽象艺术创作反而更难了。这次更新是王者归来,还是另有隐情?
北京时间3月18日下午1点13分,Midjourney 官方账号突然发推:
"Today we're starting to test an early version of our V8 model with our community. It's much better at following prompts, 5x faster, has native 2K modes, improved text rendering and the best personalization, sref, and moodboard performance ever. Have fun!"
「今天我们开始在社区中测试 V8 模型的早期版本。它在遵循提示词方面表现更好,速度快5倍,具有原生2K模式,改进的文本渲染,以及有史以来最好的个性化、sref 和情绪板性能。玩得开心!」

▲ Midjourney 官方推文,12小时内获得131.6万浏览、1549个赞
没有预热,没有倒计时。V8 就这样直接扔到了 alpha.midjourney.com 上。
5倍速度提升——这意味着什么?以前生成一张图需要30秒,现在只要6秒。对于需要大量迭代的创作者来说,这是生产力的质变。
原生2K分辨率——不再需要后期放大,直接输出高清图像。印刷、大屏展示、专业设计,终于不用再担心糊成马赛克。
但最让人兴奋的,是文本渲染的改进。AI 生成图像最大的痛点之一,就是文字总是歪歪扭扭、错字连篇。如果 V8 真的解决了这个问题,那对海报设计、广告创意来说,简直是降维打击。
发布后不到12小时,全球创作者就开始疯狂测试。
认证用户 Alex Patrascu (@maxescu) 直接花了6个小时,把 V8 和市面上所有主流图像模型挨个对比了一遍。
他的结论让人意外:
"I spent 6 hours testing Midjourney v8 against every major image model. Conclusions: 1. v8 is better when you use a profile 2. If you push --s to higher levels, you start to get the same person 3. v8 in RAW mode is subpar 4. v8 lacks fidelity"
「我花了6小时测试 Midjourney v8 与所有主要图像模型的对比。结论: 1.使用配置文件时 v8 更好2. 如果将 --s 推到更高级别,会开始生成相同的人物3.v8 的 RAW 模式表现不佳4.v8 缺乏保真度」

▲ Alex Patrascu 的6小时测试结论
RAW 模式翻车?这可是很多专业用户的核心功能。
更让艺术创作者担忧的,是另一位认证用户 Remi X (@its_me_remi) 的发现:
"Midjourney v7 vs v8. It seems it's much more difficult now to make abstract art. 'Regular' images look better but artistic exploration is much harder."
「Midjourney v7 对比 v8。现在制作抽象艺术似乎更加困难了。'常规'图像看起来更好,但艺术探索变得更难。」

▲ Remi X 对比 V7 和 V8 在抽象艺术方面的表现
这是一个危险的信号。Midjourney 一直以来的核心用户群,就是那些追求艺术表达、风格实验的创作者。如果 V8 为了「更好地遵循提示词」,反而牺牲了创作自由度,那这次更新到底是进步还是倒退?
更技术的问题还在后面。
认证用户 PixelTraveler (@GrokIMjourney) 发现,V8 的风格参考参数(--sref)行为完全变了:
"Obviously, there are lots of problems with V8, but it's still in alpha, so all kinds of issues are expected. It behaves quite differently: --sref influence is much stronger, yet also feels qualitatively different from V7."
「显然,V8 存在很多问题,但它仍处于 alpha 阶段,所以各种问题都是预期的。它的行为完全不同:--sref 影响力强得多,但在质量上与 V7 感觉不同。」

▲ PixelTraveler 分析 V8 的参数行为变化
对于已经摸透 V7 参数规律、建立了完整工作流程的专业用户来说,这意味着什么?
意味着要重新学习。
你之前调好的参数组合,在 V8 上可能完全失效。你花了几个月摸索出来的风格配方,现在要推倒重来。
这就是 AI 工具的残酷之处——每次大版本更新,都是一次「技能清零」。
不过,也有人看到了新的可能性。
日本创作者田中義弘(@taziku_co,taziku CEO)展示了一个让人眼前一亮的案例:用 V8 生成的图像作为首帧,结合视频生成 AI 制作动态作品。
"Midjourney v8 α の実力。v8αと動画生成AIの組み合わせで制作された動画作品。アートワークについては、従来の通り世界観があり、かなり良い精度。動画に展開するにもファーストフレームの絵づくりや視点はかなり重要。レベルが一段上がりそうな予感。"
「Midjourney v8 α 的实力。使用 v8α 和视频生成 AI 组合制作的视频作品。关于艺术作品,一如既往地具有世界观,精度相当高。在展开为视频时,首帧的画面制作和视角也相当重要。有预感水平会上升一个台阶。」

▲ 田中義弘展示 V8 与视频生成 AI 的结合案例
这才是真正的未来方向。
静态图像生成已经是红海,下一个战场是图生视频。V8 的2K原生分辨率、更好的提示词理解,恰好为视频生成提供了更高质量的起点。
当然,也有人不买账。
用户 @dreamdecko 直接开喷:
"They release the V8 and its not official yet, its 'ALPHA'. been developing v8 for too long. and other models are already in 2050 yet @midjourney still stuck in 2020"
「他们发布了 V8,但还不是正式版,是'ALPHA'。V8 开发时间太长了。其他模型已经到了2050年,而 @midjourney还停留在2020年」

▲ 用户批评 Midjourney 开发速度过慢
这个批评不是没有道理。
DALL-E 3 已经深度集成进 ChatGPT,Stable Diffusion 社区每天都在爆发新玩法,Adobe Firefly 直接嵌入了整个 Adobe 生态。
而 Midjourney?还在 Discord 里用命令行生图。
V8 的速度提升、分辨率提升,这些都是追赶性的改进,而不是颠覆性的创新。
但话说回来,Midjourney 官方明确标注了:这是 alpha 版本。
Alpha 意味着什么?意味着这不是最终形态,意味着问题是预期的,意味着还有大量改进空间。
官方在第二条推文中写道:
"A much longer followup V8 post from our blog: Hi everyone! Today we're letting the community test an early version of our V8 model on http://alpha.midjourney.com. We want your feedback and your help. Let's explore what this new model can do."
「来自我们博客的更长的 V8 后续帖子:大家好!今天我们让社区在 http://alpha.midjourney.com 上测试 V8 模型的早期版本。我们需要你的反馈和帮助。让我们一起探索这个新模型能做什么。」

▲ Midjourney 引导用户到 Alpha 平台测试并提供反馈
这是 Midjourney 一贯的策略:社区驱动的迭代开发。
V7 也是这样一路改进过来的。最初版本问题一堆,经过几个月的社区反馈和持续更新,才成为现在大家认可的稳定版本。
V8 现在的问题——RAW 模式不佳、抽象艺术困难、参数行为变化——这些都可能在后续版本中得到解决。
关键是,Midjourney 愿意把半成品拿出来让用户测试,而不是闭门造车憋大招。
回到最核心的问题:5倍速度提升是怎么做到的?
可能的技术路径有几个:
1.模型架构优化——更高效的神经网络结构,减少计算量 2.硬件加速——更好地利用 GPU 并行计算能力 3.推理优化——量化、剪枝、蒸馏等模型压缩技术 4.分布式计算——更智能的任务调度和资源分配
无论是哪一种,5倍速度提升都不是小数字。这意味着 Midjourney 在底层技术上确实有了实质性突破。
而原生2K分辨率,更是直接解决了一个长期痛点。以前生成高分辨率图像,要么用 upscale 功能(慢且容易失真),要么用第三方工具放大(效果参差不齐)。现在直接原生输出2K,这对专业用户来说是质的飞跃。
如果说速度和分辨率是量的提升,那么文本渲染的改进就是质的突破。
AI 生成图像的文字问题,一直是行业公认的难题。为什么?
因为文字不仅仅是视觉元素,它还承载着语义信息。AI 需要同时理解「这里应该有文字」和「这些文字应该写什么」,这比生成一张脸、一棵树要复杂得多。
如果 V8 真的在文本渲染上有了显著改进,那它的应用场景会瞬间扩大:
这才是真正的生产力工具。
V8 强调的另一个重点,是「有史以来最好的个性化、sref 和情绪板性能」。
这三个功能,是 Midjourney 区别于其他 AI 图像工具的核心竞争力:
这些功能给了创作者精确的风格控制能力。
你不再是在「抽卡」,而是在「定制」。
但问题是,正如前面用户反馈的,V8 的 --sref 参数行为变化太大,影响力比 V7 强得多。这意味着什么?
意味着你需要重新校准。
以前 --sref 100 的效果,现在可能只需要 --sref 50。你的参数配方要全部重新调整。
这对老用户来说是痛苦的,但对新用户来说,可能反而是好事——他们不需要背负历史包袱,可以直接从 V8 开始学习。
回到最初的问题:V8 到底是王者归来,还是另有隐情?
从数据上看,V8 是进步的:
从用户反馈看,V8 是分裂的:
这其实反映了一个更深层的问题:AI 工具的进化方向,到底应该是「更听话」还是「更有创造力」?
V8 选择了前者。它更好地遵循提示词,更精确地控制风格,更稳定地输出结果。
但代价是,它可能失去了一些「意外之喜」——那些你没有预期、但 AI 给你带来的惊喜。
对于商业用户来说,V8 是福音。他们要的就是稳定、可控、高效。
对于艺术创作者来说,V8 可能是一种妥协。他们要的是探索、实验、突破边界。
V8 现在只是 alpha 版本。
根据 Midjourney 以往的节奏,从 alpha 到正式版,至少还要几个月的迭代。
在这几个月里,社区的反馈会持续涌入,开发团队会不断调整。
RAW 模式的问题,可能会被修复。 抽象艺术的困难,可能会被优化。 参数行为的变化,可能会被平滑。
但有一点是确定的:AI 图像生成的战争,远没有结束。
Midjourney V8 的发布,只是这场战争的一个新章节。
DALL-E、Stable Diffusion、Adobe Firefly,每一个都在虎视眈眈。
而真正的战场,已经从静态图像,转移到了图生视频、3D 生成、实时渲染。
V8 的5倍速度提升,可能只是为了给视频生成腾出计算资源。 V8 的2K原生分辨率,可能只是为了给 3D 建模提供更好的纹理。 V8 的文本渲染改进,可能只是为了给多模态 AI 打下基础。
这才是真正的大棋。
文章来自于微信公众号 “虾智”,作者 “虾智”
【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用:https://aicomicfactory.app/
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0