前几日,号称“AIGC第一股”的美图悄悄上线了一个新的AI Agent——RoboNeo,并且这款产品在昨天(7月22日)“悄悄”登上了国区App Store图形与设计免费榜一的宝座。
就像其分类,RoboNeo是一款专注于影像和设计的AI智能体应用,核心功能是通过自然语言对话,直接让AI成为“乙方”,给你P图、做设计、制作视频等等。这项功能,与三个月前火遍AI Agent圈的Lovart基本一致。值得一提的是,Lovart也于前不久化身“星流 Agent”在国内市场上线,并且二者都号称是“更懂中国设计师”的AI Agent,这也让我们更为好奇,Lovart和美图RoboNeo,到底哪个更强?
01
Lovart的大名,相信关注AI Agent的朋友一定不陌生。在近三个月前,全球首个设计Agent——Lovart率先在海外市场曝光。这款由华人创始人推出的Agent产品,上线仅24小时便涌入超2万名用户,官方视频播放量突破百万,并获得了马斯克的疯狂点赞,迅速引爆了科技圈。
Lavart的现象级革新,在于其突破了AI工具属性的桎梏,将AI从一个辅助角色成功打造成了一个“一人成团”的Agent团队。
在Lovart中,用户可以和AI在同一块画布上写作,只需要通过简单的语言指令,就能让AI帮你快速生成你所需要的图片、设计、视频等。如果不满意,只需要提出修改要求,它就会自己进行调整,可以说真正实现了从概念到交付的全流程自动化。
根据官方数据显示,Lovart上线仅三个月,用户量便突破了200万,单日营收峰值超过50万美元,并且付费转化率达到了惊人的15%,最值得注意的是,它的中国用户占比超过一半以上。
在如此大的用户基数背景下,Lovart顺势推出了中国版应用——星流Agent,据悉,星流Agent和Lovart最大的异同就是更适配中国地区,优化了对中文语义的理解,并且融入了东方美学要素,誓要做“更懂中国人的设计师”。相对而言,美图推出的RoboNeo在时间上则来的稍晚一些。
核心功能角度上,二者基本一致,都可以实现一句话生图修图,并且可以支持画布上自由设计&编辑。目前,RoboNeo对所有用户免费开放,无需邀请码即可直接使用。
我们实际测试了RoboNeo的生成效果,在理解语义上,RoboNeo的表现可圈可点。首先,在用户给出指令后,RoboNeo AI会根据用户需求进行图像分析,从文字元素、构图、色彩搭配等多个角度给出自己的见解,在用户需求比较模糊的情况下,还会进一步给出优化点分析,为用户的后续修改提供灵感。
比如,笔者要求设计一张封面图,仅给出了夏日海滩、黄昏两个关键词,RoboNeo在短短几秒内迅速给出了两张图,并且在后续附上了图像和优化分析。但或许是由于网络因素,在后续的修图指令下,RoboNeo的反应速度略慢,修改一张图所需时间拉长到了40s左右。
除了语言指令修改之外,RoboNeo也采用了分屏设计,用户可以直接在右侧画布上点击图片进行修改,包括AI改图、扩图、超清、无痕消除/改字、添加到聊天进行针对性调整等等,比如下方右侧图片,就是笔者要求扩图后的效果,光影、色彩、线条等都可见具备一定的设计审美。
如果忽略网络质量差异,RoboNeo在下达简单需求后的响应速度基本在20s左右,甚至偶尔生成时间还会缩短至10s内(比如简单的消除、微调),堪称迅速。不过,在一些复杂指令或者高难度需求上(比如要求该图片变成动图,或者生成更有技术难度的3D模型等),RoboNeo往往需要更长的等待时间以及多轮对话才能达到相对理想的效果。
再来看星流。相比RoboNeo的免费开放,星流则选择了会员制+限免模式,新用户赠送150点能量,每生成一张图需要花费一点能量。在内容方面,免费用户可以使用的功能相对较少,需要更高级会员才可以享受更多的功能和模型效果,最重要的是,只有会员才可以商用生成的图片。
笔者将同样的简单描述喂给星流,得到的图片风格与RoboNeo具有较大差别,RoboNeo理解的角度更偏海报风格,而星流则更有“浪漫电影风”。
此外,相较于RoboNeo相对简洁的对话框设计,星流则在对话框处增添了一些工作流,如图生图、图片/颜色参考、生图尺寸等,能够方便用户更加直接地调整需求;同时,用户还可以手动选择基础模型来实现自己想要得到的生成效果。目前,星流提供了四种基础模型,更多的基础模型则需要开启高级模式才可以查看。
就目前的使用体验而言,星流在响应/修图速度以及创意融合方面更占优势。但在进一步理解用户语意、以及面对更复杂的指令时,同样展示出了一些错误的理解,需要人工辅助多轮修正才能达到想要的效果。
结语
总结来看,二者目前在产品效果方面都存在一些亟待解决的问题,但无论是整体表现,还是其试图成为“乙方”,努力理解用户需求、提供解决方案、自主修改等层面,都意味着二者所代表的AI设计品类正在突破传统AI助手的局限,向更智能、更个性化的方向发展。专业场景的需求推动技术创新,技术创新又反过来拓展应用边界。在这个过程中,产品与用户的互动会变得更紧密,算法迭代更加高效,商业变现路径也更加清晰。基于此,已经可以预见的是,这种模式还将吸引越来越多的创业者和资本进入,并持续提高AI Agent的天花板。
文章来自公众号“扬帆出海”,作者“汪酱”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner