无限上下文、无限推理、无限输出,这个AI凭什么敢说"无限"?| Flowith 详细体验实测

搜索
AI-TNT
正文
资源拓展
无限上下文、无限推理、无限输出,这个AI凭什么敢说"无限"?| Flowith 详细体验实测
2025-05-22 15:08

Flowith 发布了它们最新的 Agent,Neo,这是世界上第一个能够做到无限上下文,无限推理步骤的 Agent,并且它还拥有着无限输出的能力。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

flowith 介绍


一个有意思的点是,上一代它们的 Agent 其实是叫 Oracle, 而这一次,他们没有延续之前的名字,而是改了个名字叫 Neo。它们说,这个灵感来自于他们喜爱的一部电影,黑客帝国,但是不包括最新的一季。

那作为 flowith 的老用户,甚至都不需要邀请码,就直接升级 Neo 了。


我也详细测试了一番,看看 Neo 到底效果怎么样,下面分享几个 case 给大家看看效果。


测试


案例 1:调研报告生成


第一个 case, 先来个简单的,做一个调研报告生成。我让 Neo 自己调研自己。


任务指令可以说是非常的粗糙,主打一个随意。


帮我完成一份关于 flowith 这个产品的深度调研报告,要囊括其最新的产品特点,信息等。
最后制作成一个精美的网页用于展示!


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 测试案例 1


我非常喜欢 Flowith 整体的页面交互设计。从页面左侧可以看到,Neo 把我非常烂的指令拆解成了整整 13 个步骤,每一步该做什么都被规划的清清楚楚;在页面右侧,用户可以看到 Neo 在每一个环节的输出结果,让每一个环节都更加可控。


在这份 case 中,我分享几个我认为比较有趣且值得重点关注的点:


  • Neo 的搜索并不是只做单次搜索就进入下一步,而是同时调用多个搜索工具,进行并发式的搜索,来减小内容上的误差。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 测试案例 1-1


  • 除了文本的搜索之外,它还会搜索图片素材。Neo是少有的同时注意图像搜索和文本搜索的 Agent


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 测试案例 1-2


  • 对于文档报告的撰写,Neo 的实现方式是拆分式的或者说式模块化的,不是一次性傻傻的写完所有的东西,而是一次写一个模块的内容。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 测试案例 1-3


  • 在写完报告之后,Neo 还有两个步骤是比较关键的,就是“反思 + 提升”。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 测试案例 1-4


以上基本上可以看作一个 Agent 的规范工作流程。不过,因为我的提示词实在是太粗糙了,强如 Neo 这样的超级Agent,生成出来的网页都是奇丑无比。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 测试最终结果


好在,Neo 是支持“Human in the loop”这个定义,当发现结果不够满意的时候,还可以继续提出需求让 Neo 进行修改。所以我又让它稍加修改润色了一下,马上就有了些不同。


现在界面长下面这样:


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 修改结果


完整的网页链接放在这里了,可以点击查看: https://flo.host/TdfNZAb/#future-outlook


现在的这个美观程度明显比之前有了很大的提升。非常不错!


案例 2:短剧剧本创作


AI + 短剧一直是一个非常热门的赛道。基本上一个 AI 短剧视频前期的工作流可以分为剧本人物大纲撰写、剧情编写、分镜脚本编写,分镜图像生成等。 而这其中,如何确保角色的一致性,一直是一个比较难的问题。


我也用 Neo 测试了一下 AI+短剧的可能性。 使用的提示词如下,同样非常粗糙:


帮我写一个短剧剧本,剧本要求涉及当下热度最高的短剧题材,然后根据题材内容,生成短剧中的人物角色图像,和分镜图。


这里,Neo 有一个细节,其实也是我在案例 1 里提到的“Human in the loop”,它在搜索完一些当前最热门的题材之后,会征求我的意见,问我最感兴趣的题材,让我给出明确的定义。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 2-1


确定好题材之后,它开始制定剧本大纲,包括角色设定,故事梗概,故事核心冲突与发展,主要情节节点。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 2-2


之后,Neo 开始剧本详细的创作。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 2-3


这个剧本创作的非常详细,一共十集,包括了人物对话,动作指导,场景的切换。这里因为长度关系,我就放出了部分。


完成这部分后,Neo 接着会挑选关键的场景,并且对它们进行分镜描述。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 2-4


完成了这部分后,Neo 接下来会执行分镜图像的生成。


但是这里遇到了问题,每个图像的风格和人物都出现了不一致性。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 2-5


不过,这里除了人为的去干预,保证一致性以外,光靠 Agent 自己去做到一致性,估计目前还是比较有难度的。


最后,在关键的图像生成好后,Neo 会做成一个网页进行汇总展示。


但是在这个环节里发现一个问题,就是 Neo 发现最后生成的网页,还有一些潜在的修复点,可以提升,出具了一份分析报告,然后根据这份分析报告进行二次修改的时候,反而把原先对的人物名称,图像都给改错了。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 2-6 正确部分


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 2-7 错误部分


这类错误其实也算比较普遍,如果经常 Vibe Coding 的小伙伴,肯定再熟悉不过。这类 Agent - 全自动模式下,非常容易出现把原先对的改成错的。


总的来说,Neo 在这个任务里我觉得做的能有 70-80 分之间吧。大部分的子任务里,我觉得它表现的都是 ok 的。毕竟 Agent 的底层逻辑是对强有力模型的依赖。


案例 3: 游戏制作


我对 Neo 做成个愤怒的小鸟其实没啥预期,但是我还是测试了一下。提前透露:这是个badcase。


我使用的提示词如下:


帮我制作一个像素风格的游戏,叫愤怒的小鸟。完整的记分系统,玩家排行榜等这些一个游戏的必备要素。


在这个 case 里,Neo 做的比较好的地方是对需求的拆解,非常详细。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 3-1


这个 case 失败的主要原因是从 Neo 发现测试工具无法访问到生成的游戏,导致无法继续测试游戏的效果。然后,它询问了我的建议。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 3-2


我让它继续执行后面的工作,所以,它就直接写了个交付文档给我,表示任务已经结束了。


虽然这个 case 最后没有成功,但是比较有意思的是我发现 Neo 还掌握了不少工具,比如给我发送邮件,是真的有收到!第一次收到来自 AI 的邮件,还是感觉蛮特别的。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 3-3


p.s. 这个 case 我应该还会再多测测,感觉应该是能够成功的,可能跟我的 prompt 也有关系。


案例 4:落地页设计


Neo 是一个全能选手,还可以让它来进行品牌落地页的设计, 比如: 我想给 Prada 设计一个落地页。


Neo 的生成效果如下所示:


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 4-1


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 4-2


因为图片大小的限制原因,只能分别截图来展示。


完整的网页地址在:https://flo.host/MRa2JGh/


其实到这所有都看上去非常完美了。


但在这个 case 里,我还发现一个问题,就是反思阶段,Neo 发现自己生成的效果还有提升空间,然后会选择进一步提升,但是这个进一步提升往往会带来倒退的效果。 比如下面这样:


无限上下文、无限推理、无限输出,这个AI凭什么敢说

Flowith 案例 4-3


可以看到,新提升之后的落地页下方原有的精美的引导示意图都没了,导致整个落地页一下子变得非常空洞。


其实,之前看过 Google 的一篇论文叫Large Language Models Cannot Self-Correct Reasoning Yet,讲的就是关于模型自我反思,进一步提升这一点。大概意思是说,不要轻易的让模型去自我纠正。大部分的模型自我纠正后,效果反而会降低。


感觉放到如今 Agent的环境中,这个论点也是值得相信的。毕竟 Agent 的底座就是模型,一个好的 Agent 离不开一个强有力的模型支撑。轻易的去让模型做自我反思,审查,容易把原本是对的内容改坏掉。


写在最后


好啦,本次的体验到这里就结束了。欢迎小伙伴们多多体验,挖掘出更多好玩的玩法~


在本文中我们通过4 个case 详细地体验了一下 Flowith 的新 Agent,Neo,的强大之处。作为一个 Agent 产品,虽然目前还有一些不完善之处,但是它执行的每一个步骤,规划,工具调用,执行,反思,总结都是一个优秀的 Agent 必备的技能,也希望大家能够在体验的同时,多多感悟和学习,开发出更加优秀的 Agent。


文章来自于“BubbleBrain”,作者“DylanDDeng”。


无限上下文、无限推理、无限输出,这个AI凭什么敢说

1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

IOS下载
安卓下载
微信群
沪ICP备2023015588号