嗨,我是饼干哥哥。
先给你们看个刺激的:国外有个哥们儿,自己一个人用 AI做 3D 模型,最高单日收入折算快 1 万人民币了:
一年收入30 万刀。而他在用的也只是通过提示词让 AI 生成对应的 3D 模型,或者上传图片生成 3D 模型。
这玩法可能是个风口上的印钞机。
我在小红书上也刷到AI生成3D模型的玩法,好家伙,帖子下面马上就有国外的IP找上门来求合作。
按作者的市场情报,一个3D打印的定制手办,轻轻松松卖到 200-600元/个。
你是不是觉得3D建模这活儿,门槛高得能上天?以前或许是,但现在,时代变了!
因为腾讯混元3D来了,直接把门槛从珠穆朗玛峰一脚踹到了马里亚纳海沟,效果还好到离谱!
有多简单呢?有手就行!!
我今天刷Reddit(海外论坛 )的时候,有用户求助,说她儿子很喜欢Funko pop公仔,想给他打印一个,但死活搞不定模型文件,急得愿意花钱求助。
机会来了!于是我打开腾讯混元 3D,随手把帖子里的图片一传,全程默认配置,连脑子都没动:
不夸张,就一杯咖啡的功夫都没有,一个精细的3D模型就蹦出来了:
最骚的是,还能直接下载文件!这钱不就到手了吗?哈哈
接下来,饼干哥哥就手把手带你玩转这个搞钱神器,让带你体验一线做“3D 模型”的流程是怎么样的。
腾讯混元大模型是腾讯自家的“亲儿子”,主打开源。
老实说,在广东的腾讯风格就是个“扫地僧”,贼低调,不了解的同学可以看下下图,悄无声息的就已经发布开源了这么多个模型了。。
其中,混元3D系列模型社区下载量超过260万,是全球最受欢迎的3D开源模型。
就在前几天,9 月 16 日的时候腾讯混元3D 发布了 3.0 版本,参数极其恐怖:几何分辨率高达1536³,支持 36 亿体素超高清建模。
什么概念?
上一个版本是 2.5,就已经是在海外屠榜的存在,性能全球第一。
现在其他家都还没跟上,腾讯反手就出了 3.0,可见含金量。
对比于之前 2.5 的版本,3.0在精细程度上提高了一个 level
例如下图的小女孩,最右边的3D 脸就很接近我们在电视上看到的动漫了,而 2.5 的好像是好几年前老动画的感觉。
原图
混元 2.5
混元 3.0
这种感觉,就像当下最火的国漫《凡人修仙传》一样,左边是第一季的建模,右边是年番的建模,从皮肤纹理到眼神光,完全是质的飞跃。
注:这里只是拿动漫解释建模的代差,不是说韩老魔是混元做的哈。
入口在这:https://3d.hunyuan.tencent.com
目前是每日享有20次免费生成次数,直接上手试下。
文章开头那个案例,只能算青铜玩法,只传了一张图。 但很多时候,我们设计的角色后背、侧面都有戏。
这时候,就可以上传多个视角的图片,让AI看得更全面。
例如这个是我之前用 Nano banana 生成的动漫人设,里面刚好就有3 个视角的图
效果真不错,可以看到,尤其是面部还原度很高
还有更有趣的玩法,点旁边的「自动绑骨」,混元能自动识别模型的人体结构,进而做出不同的动作,来实现动画效果
好激动!跳起来了!你说放以前,没几个月的学习能做出来这种效果吗?
现在在混元 3D 里真的一键就解决了。
绑骨的难度,难就难在识别哪里是关节,哪里能动。能动的地方越多,动画才越活。
所以上面人物的绑骨蒙皮算简单了
一些动物的就更难了:
甚至是这个黄蜂人,属于是地狱级难度的了
“绑骨”的技术核心,在于混元3D惊人的“结构理解能力” 。
首先,它具备跨物种的语义识别能力,能精准分析人形、四足动物、乃至黄蜂人这种复杂异形生物的结构,并生成符合生物力学的骨骼。
其次,它实现了高质量的自动蒙皮(Auto-Skinning),能智能计算权重,确保模型在运动时关节平滑、无撕裂,解决了手动绑定中最耗时的难题。
这背后,是AI对3D拓扑和生物动态学的深度认知,将过去专业人士数天的工作自动化,是一次真正的技术跨越。
在混元面前,这些曾经的难题,都成了小菜一碟。
但以上,其实只是入门级别的玩法, 如果想真正「落地」,满足客户不同的 3D 模型需求,或是真正应用到动画、游戏里,那就是一整套「流水线」的活了
正好,腾讯还发布了专业级AI工作台——混元3D Studio,目前已放开角色、道具模块
混元3D Studio提供了从头到尾、一条龙的3D AI创作服务。不管你是要前期画概念图、建模型,还是要后面拆分组件、优化模型(低模拓扑),甚至是上色(贴图)、绑骨架、做动画,它全包了!
可以看上面的模型,从概念图设计一直到最后的动画效果,一站式的都在这个 studio 解决了
接下来,我们就来探一探,用这个“专业工作室”跑一个模型,是什么样的神仙体验。
Studio 集成了生图模型,包括文生图、图生图(多视图),背后用的是混元生图 2.1 版本。
还是用上面的动漫人物来试下,如果我只有一张图,就能帮我生成有图那样的 4个视图
这一步,建议要把标准化 A-pose打开,要不然最后可能动画特效就生成不了了
同时,还能玩“风格化”,一键变成Q版、像素风,创作空间瞬间打开!
也就是把 2D 图片,转成 3D 模型
到这一步,一个立体的、可以360度把玩的模型就诞生了!
这一步是识别出 3D 模型有多少部分组成,拆出来,后续才可以针对性的调整
手动去拆?那得是师傅对着屏幕点几个小时的枯燥活儿。
在这里,AI秒秒钟搞定!
例如这里,混元 3D 帮我拆成了 16 个部位,这样我就可以单独调整头发、衣服、袖子等等,非常精细
这一步是干啥呢?
我们可以看到现在模型有 45 万横截面、136 万个顶点,太高精度了,后期电脑根本顶不住,所以就要「降维」处理,做成效果差不多但更轻巧的模型。
「拓扑选择」参数方面,如果是做游戏就选三角面、如果是做动画就选四边面。
对于更专业的流程,还可以做「UV 展开」,也就是把一个三维(3D)模型的表面,像拆快递盒一样,沿着“接缝”剪开,然后平铺在一个二维(2D)的平面上,这样就可以用Photoshop 或者 AI 来生成贴图贴上去。
我也不是专家,就不那么麻烦,直接到「纹理绘制」让AI 帮我直接上色就好了。
非常简单,直接把图片上传后,点开始即可。
有了前面的步骤,这里就可以点选某个位置,做局部的重绘,指哪打哪!
经过前面一系列专业操作,Studio里识别出的骨骼节点,比首页那个“白银玩法”要多得多,也精细得多!
这意味着动画的细节和表现力会指数级上升!
同样,在 Studio 里,在「绑骨蒙皮」后,能做的动作也更丰富了。
试一试白银玩法的同款「原地跳」,对比一下效果。
我敲!效果好太多了吧,可以明显看到,手腕、手部、脚踝这些末端关节都有了丰富的动作细节,整个动作行云流水,充满了生命力!
再也不是“白银玩法”里那种有点僵硬的感觉了。
这,才是真正能放进动画和游戏里的专业级效果!
前段时间,谷歌、李飞飞都相继发布“世界模型”,效果很震撼,但还处在很早期。
其实,混元3D也在做这个世界模型,效果也是杠杠的,直接在首页就能看到入口。
最近沉迷《凡人修仙传》,里面的国风场景十分唯美。于是,我让 AI生成同样风格的图后,上传到腾讯混元3D
不一会就能得到 3D全景图的效果,仿佛置身仙侠世界的感觉
要是再结合混元 3D世界模型的「漫游场景」,一个可以随意在里面“行走”、“飞行”、自由探索的3D全景世界生成就不远了!
体验下来,我才真正理解腾讯混元3D的厉害之处。它的“有趣好玩”,本质上是顶尖AI技术“暴力”降低门槛的结果。
你觉得上传图片一键生成模型很神奇?背后是高精度的几何生成算法在为你服务;
你觉得能随心所欲让角色动起来很酷?那是AI对生物动态学的深度理解,帮你完成了最复杂的“绑骨”和“蒙皮”;
你觉得把模型导出用到游戏、动画里流程很顺?这得益于全自动的低模拓扑和UV展开,AI把最枯燥的优化工作全包了。
它做的,其实是把过去3D创作中最劝退、最耗时的专业步骤,用强大的AI技术“黑箱”化处理。
它留给你的,几乎只剩下纯粹的创作乐趣。
这既是它能满足小白探索欲的原因,也是它能为专业人士极致提效的底气。
3D创作的“大航海时代”,真的来了!
文章来自于微信公众号 “饼干哥哥AGI”,作者 “饼干哥哥AGI”
【开源免费】LGM是一个AI建模的项目,它可以将你上传的平面图片,变成一个3D的模型。
项目地址:https://github.com/3DTopia/LGM?tab=readme-ov-file
在线使用:https://replicate.com/camenduru/lgm
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0