Flowith 发布了它们最新的 Agent,Neo,这是世界上第一个能够做到无限上下文,无限推理步骤的 Agent,并且它还拥有着无限输出的能力。
flowith 介绍
一个有意思的点是,上一代它们的 Agent 其实是叫 Oracle, 而这一次,他们没有延续之前的名字,而是改了个名字叫 Neo。它们说,这个灵感来自于他们喜爱的一部电影,黑客帝国,但是不包括最新的一季。
那作为 flowith 的老用户,甚至都不需要邀请码,就直接升级 Neo 了。
我也详细测试了一番,看看 Neo 到底效果怎么样,下面分享几个 case 给大家看看效果。
第一个 case, 先来个简单的,做一个调研报告生成。我让 Neo 自己调研自己。
任务指令可以说是非常的粗糙,主打一个随意。
帮我完成一份关于 flowith 这个产品的深度调研报告,要囊括其最新的产品特点,信息等。
最后制作成一个精美的网页用于展示!
Flowith 测试案例 1
我非常喜欢 Flowith 整体的页面交互设计。从页面左侧可以看到,Neo 把我非常烂的指令拆解成了整整 13 个步骤,每一步该做什么都被规划的清清楚楚;在页面右侧,用户可以看到 Neo 在每一个环节的输出结果,让每一个环节都更加可控。
在这份 case 中,我分享几个我认为比较有趣且值得重点关注的点:
Flowith 测试案例 1-1
Flowith 测试案例 1-2
Flowith 测试案例 1-3
Flowith 测试案例 1-4
以上基本上可以看作一个 Agent 的规范工作流程。不过,因为我的提示词实在是太粗糙了,强如 Neo 这样的超级Agent,生成出来的网页都是奇丑无比。
Flowith 测试最终结果
好在,Neo 是支持“Human in the loop”这个定义,当发现结果不够满意的时候,还可以继续提出需求让 Neo 进行修改。所以我又让它稍加修改润色了一下,马上就有了些不同。
现在界面长下面这样:
Flowith 修改结果
完整的网页链接放在这里了,可以点击查看: https://flo.host/TdfNZAb/#future-outlook
现在的这个美观程度明显比之前有了很大的提升。非常不错!
AI + 短剧一直是一个非常热门的赛道。基本上一个 AI 短剧视频前期的工作流可以分为剧本人物大纲撰写、剧情编写、分镜脚本编写,分镜图像生成等。 而这其中,如何确保角色的一致性,一直是一个比较难的问题。
我也用 Neo 测试了一下 AI+短剧的可能性。 使用的提示词如下,同样非常粗糙:
帮我写一个短剧剧本,剧本要求涉及当下热度最高的短剧题材,然后根据题材内容,生成短剧中的人物角色图像,和分镜图。
这里,Neo 有一个细节,其实也是我在案例 1 里提到的“Human in the loop”,它在搜索完一些当前最热门的题材之后,会征求我的意见,问我最感兴趣的题材,让我给出明确的定义。
Flowith 案例 2-1
确定好题材之后,它开始制定剧本大纲,包括角色设定,故事梗概,故事核心冲突与发展,主要情节节点。
Flowith 案例 2-2
之后,Neo 开始剧本详细的创作。
Flowith 案例 2-3
这个剧本创作的非常详细,一共十集,包括了人物对话,动作指导,场景的切换。这里因为长度关系,我就放出了部分。
完成这部分后,Neo 接着会挑选关键的场景,并且对它们进行分镜描述。
Flowith 案例 2-4
完成了这部分后,Neo 接下来会执行分镜图像的生成。
但是这里遇到了问题,每个图像的风格和人物都出现了不一致性。
Flowith 案例 2-5
不过,这里除了人为的去干预,保证一致性以外,光靠 Agent 自己去做到一致性,估计目前还是比较有难度的。
最后,在关键的图像生成好后,Neo 会做成一个网页进行汇总展示。
但是在这个环节里发现一个问题,就是 Neo 发现最后生成的网页,还有一些潜在的修复点,可以提升,出具了一份分析报告,然后根据这份分析报告进行二次修改的时候,反而把原先对的人物名称,图像都给改错了。
Flowith 案例 2-6 正确部分
Flowith 案例 2-7 错误部分
这类错误其实也算比较普遍,如果经常 Vibe Coding 的小伙伴,肯定再熟悉不过。这类 Agent - 全自动模式下,非常容易出现把原先对的改成错的。
总的来说,Neo 在这个任务里我觉得做的能有 70-80 分之间吧。大部分的子任务里,我觉得它表现的都是 ok 的。毕竟 Agent 的底层逻辑是对强有力模型的依赖。
我对 Neo 做成个愤怒的小鸟其实没啥预期,但是我还是测试了一下。提前透露:这是个badcase。
我使用的提示词如下:
帮我制作一个像素风格的游戏,叫愤怒的小鸟。完整的记分系统,玩家排行榜等这些一个游戏的必备要素。
在这个 case 里,Neo 做的比较好的地方是对需求的拆解,非常详细。
Flowith 案例 3-1
这个 case 失败的主要原因是从 Neo 发现测试工具无法访问到生成的游戏,导致无法继续测试游戏的效果。然后,它询问了我的建议。
Flowith 案例 3-2
我让它继续执行后面的工作,所以,它就直接写了个交付文档给我,表示任务已经结束了。
虽然这个 case 最后没有成功,但是比较有意思的是我发现 Neo 还掌握了不少工具,比如给我发送邮件,是真的有收到!第一次收到来自 AI 的邮件,还是感觉蛮特别的。
Flowith 案例 3-3
p.s. 这个 case 我应该还会再多测测,感觉应该是能够成功的,可能跟我的 prompt 也有关系。
Neo 是一个全能选手,还可以让它来进行品牌落地页的设计, 比如: 我想给 Prada 设计一个落地页。
Neo 的生成效果如下所示:
Flowith 案例 4-1
Flowith 案例 4-2
因为图片大小的限制原因,只能分别截图来展示。
完整的网页地址在:https://flo.host/MRa2JGh/
其实到这所有都看上去非常完美了。
但在这个 case 里,我还发现一个问题,就是反思阶段,Neo 发现自己生成的效果还有提升空间,然后会选择进一步提升,但是这个进一步提升往往会带来倒退的效果。 比如下面这样:
Flowith 案例 4-3
可以看到,新提升之后的落地页下方原有的精美的引导示意图都没了,导致整个落地页一下子变得非常空洞。
其实,之前看过 Google 的一篇论文叫Large Language Models Cannot Self-Correct Reasoning Yet,讲的就是关于模型自我反思,进一步提升这一点。大概意思是说,不要轻易的让模型去自我纠正。大部分的模型自我纠正后,效果反而会降低。
感觉放到如今 Agent的环境中,这个论点也是值得相信的。毕竟 Agent 的底座就是模型,一个好的 Agent 离不开一个强有力的模型支撑。轻易的去让模型做自我反思,审查,容易把原本是对的内容改坏掉。
好啦,本次的体验到这里就结束了。欢迎小伙伴们多多体验,挖掘出更多好玩的玩法~
在本文中我们通过4 个case 详细地体验了一下 Flowith 的新 Agent,Neo,的强大之处。作为一个 Agent 产品,虽然目前还有一些不完善之处,但是它执行的每一个步骤,规划,工具调用,执行,反思,总结都是一个优秀的 Agent 必备的技能,也希望大家能够在体验的同时,多多感悟和学习,开发出更加优秀的 Agent。
文章来自于“BubbleBrain”,作者“DylanDDeng”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0