HeyGen不是给人用的

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
资源拓展
HeyGen不是给人用的
2026-06-02 12:22

HeyGen不是给人用的


「狂开历史倒车」


很多人没听过HeyGen。一句话概括:HeyGen公司是平行时空的Manus(视频Agent版)。


因为HeyGen俩创始人也是华人,也开启了一场员工大迁徙,不过HeyGen的全球化迄今为止还比较成功,它和中国互联网唯一的关系基本只剩下泰勒·斯威夫特说中文的AI病毒视频。


HeyGen不是给人用的


现在看来可能平平无奇,但在2023年,各个AI视频产品生成出来的玩意堪比梦话的年代,这条动作流畅口型也对得上的视频确实把大伙都吓晕了。


所以后来他们也专注Deepfake赛道,点进他们网站看到清一色全是数字人产品,除了数字人基本也不做别的。


现在靠这个业务,HeyGen的ARR已经超1亿美元了。很恐怖。


我试着用了一下,做了一个俄罗斯美女到中国不要彩礼的视频,交互体验和成品都还可以。


HeyGen不是给人用的


感觉HeyGen在园区那边应该很流行,江西很多老乡肯定被这软件害过。


不过今天写它倒不是因为突然对数字人心血来潮,是因为HeyGen最近声称自己研究出来一个所谓靠写代码就能做出视频的开源视频产品——HyperFrames。


我寻思写代码不是比剪视频难吗,要用一个更难的事去完成一个相对简单的事到底是基于什么思考?


HeyGen不是给人用的

该产品强调自己是给AI agent用的,即不是给人用的


后来搜了一下,HyperFrames这个“写代码做视频”,是这两个月新炒作出来的一个概念,叫Vibe Motion。


炒作Vibe Motion的逻辑是:


AI做视频要靠Diffusion,摸着石头过河,不仅随机性大得抽卡,还耗算力;


但是AI是天然会写前端的,前端又能实现很多动效,所以直接让AI通过写Html代码的方式做动效做视频;


而且Html代码和动效的关系是确定性的,改起来非常方便,不用天天在那抽卡了。


很美好的愿景。


其实早在2021年就有一个叫Remotion的开源项目是做这个的,只不过HyperFrames主要是写Html,Remotion是基于React框架,但这概念是早就有了。


这俩月把这概念翻炒一遍,估计是因为美国著名AI视频独角兽Higgsfield(可以理解为美国的TapNow)推了一个叫Higgsfield Vibe Motion的新产品,把人家开源社区老哥们造福社会的活给商业化了,看得HeyGen也馋坏了,赶紧跟上了。


HeyGen不是给人用的


于是我用这些Vibe Motion产品(主要是HyperFrames)做了几条视频测了一下。最后发现他们对自己定位很清晰,确实不是给人用的。


首先,想要使用HyperFrames,你必须有一个现成的AI agent,比如Codex或者Claude Code。(我用的是Claude Code。)


然后按照官网的指示,输入一系列指令让你的AI agent自行装备上HyperFrames的Skill。


HeyGen不是给人用的


安装好了之后就可以开始生成视频了。我试了一下常规节目,让它给豆包生成一个宣传片。


结果给我吓一跳。


HeyGen不是给人用的


其实字体、动效和配色还都可以,但是这TTS配音堪比古神低语。


我以为豆包被孙笑川附体了在这倒放说话呢。


问了一下,说是Bug,虽然这个Bug的原因我也没看懂。      


HeyGen不是给人用的

暂不清楚不能正常使用中文配音是不是HeyGen全球化的另一努力


为了测一下它宣传的准确性,我批量给它一些指令,发在Claude Code的对话框里,让HyperFrames对每个镜头都进行了修改。


HeyGen不是给人用的


并把配音改成了英语。成品如下:


HeyGen不是给人用的


该说不说,确实都是按照要求改的。虽然加的音效都有种应付了事的感觉。


除了和AI agent对话修改视频之外,HyperFrames还提供了一种修改方式:他们提供了一个Studio,让你能在上面通过选框的方式修改元素的字体、颜色、大小和动效。


HeyGen不是给人用的


Studio里还内置了一个Ask agent的功能,可以把视频中元素的详细信息打包成一个Prompt,这样你和AI Agent说需求的时候就更方便。


Studio左侧直接就是前端页面,你要是懂代码也可以直接上手改。


看起来很美好。但实际上这个Studio极其不稳定,改几下之后就黑屏或报错,而且都是一些我看不懂的代码问题。


HeyGen不是给人用的


我想说的是,我要是能看懂这些,能用你这产品从事生成AI视频的工作吗。


后来我又把同样的需求发给Remotion和Higgsfield Vibe Motion。


Remotion成品:


HeyGen不是给人用的


Higgsfield Vibe Motion成品:


HeyGen不是给人用的


Remotion的审美好一点,Higgsfield Vibe Motion的操作界面友好一点。但成品都大差不差,根据我浅薄的前端知识,它们能实现的动效效果也都是互通的。


然后我又想测试一下生成动态图表的效果,之前做这种视频都得去盗版网站下AE模板素材。


于是我让HyperFrames做一个视频讲解北京房价走势。


成品如下:


HeyGen不是给人用的


语音和画面都对得上,统计图表也动得很顺。


不过也不具备任何观赏价值,就是一个动态PPT的感觉。


但看着这个视频我突然理解为什么HeyGen要做Vibe Motion了:


一是因为从0做一个正经的视频模型成本太高了,做Vibe Motion本质上就是写一个Skill,也不用训练,还能填补产品空缺;


二是HeyGen本身就做数字人业务,数字人做口播视频的时候,无论是讲知识科普还是事件分析,背景放个动态PPT那确实是挺合理的。


于是我把之前的文章《AI圈炒作圣经震撼首发》发给Claude,生成出脚本之后用HeyGen生成数字人,然后再用HyperFrames生成视频做背景。


HeyGen不是给人用的


声明:这个视频右下角我的视频,动作、语音都是由HeyGen直接生成的,还模拟了我的音色。


感觉这产品很适合俞浩,有了这玩意以后他首页就不用全是一模一样的那张脸当封面了。


但其实也不是很适合俞浩,我开的Claude Plus计划,基本每5小时的算力只够生成2~3个视频。5小时够俞浩开摄像头录500个视频了。


后来我又想,既然是写html,那理论上讲就能画矢量图,理论上讲就能做简单的动画。


于是我用Claude写了一个详细的脚本,让HyperFrames生成一个南方公园风格的山姆状元故事。主要剧情是:山东开了个山姆,有人抢着当第一个进门的“山姆状元”,结果发现其他人都在当天考公去了,这人崩溃了。


HeyGen不是给人用的

取材于最近发生的真实事件


成品如下:


HeyGen不是给人用的


其实作为一个纯靠Html写出的视频,效果已经很好了。


但我们不得不承认的是,当我们把它放到「视频」这个大类里进行评判,得出的结论就是:这是一坨。


包括之前生成的广告宣传片、数据新闻短片,他们作为Html动效都是相当合格的,但作为视频都是没法上桌的。


其实归根结底就是,Vibe Motion这一波的各种产品,根本不是市场所需要的视频Agent产品。


Vibe Motion的开发者说,我们用AI让文字动起来了,根据定义,动起来的影像就是视频吗,所以我们是AI视频。


这不纯自嗨吗?


说到底你去刷刷抖音或者TikTok,有几个爆火视频跟你们生成的这玩意有任何相似之处?


换个角度讲,谁刷短视频是为了看你这个html生成的动态网页录屏?


对吧,就像你不能满世界宣传自己拍了个电影,最后说其实是拍了段《火车进站》。这是一个道理。


做产品要跟上时代,否则就是开历史倒车,影响特别坏。


再者,发明Vibe Motion的逻辑本身就有问题:


由于AI适合写html,所以我们就用AI通过写html来做视频——这根本就不是从用户需求出发的,这是从开发者视角出发的,属于纯纯倒反天罡。


根据方便而不是好用来选择开发路径,对于产品经理来讲实在太轻易了。


按照你们这么思考问题,还不如说因为大语言模型很擅长用文字回答问题,我们应该开发一个录制Chatbot对话框的产品。然后由于这其中也有AI成分,所以这也是AI视频Agent。


很幽默。


最后,作为一个人类,我用各种Vibe Motion产品,尤其是HyperFrames的时候,确实觉得这不是给人类用的。


先不论层出不穷的Bug。在下载软件、导出视频等多个场景,我都被要求打开Mac系统的终端输入代码来执行任务。


然后他还经常用六国语言对我进行代码知识的科普。


HeyGen不是给人用的


你们懂技术的人可能司空见惯,但这对我来说真的是心理恐怖般的折磨,让我回忆起那个跟着网上的攻略部署龙虾最后导致电脑黑屏死机只能去苹果店维修的夜晚🤡


HyperFrames就很鸡贼,提前说咱们这个产品是给Agent用的,官网也放了一堆代码,文档里也全是看不懂的话,感觉中心思想就是小白赶紧滚粗克,我们这里只欢迎底特律变人和极客。


真的,包括HyperFrames在内,现在很多AI产品有点像在Cosplay日本寿司师傅,通过让学徒入行十年只洗碗蒸饭的方式,把整个用餐体系神秘化,咱们食客也看不懂。问了就显得我们是土炮,还会被那些懂行的嘲笑。里外里都是我们的错。


说真的作为AI产品的消费者,我们不应该承受这么多。你们开发者要是做不出来3岁小孩都能看懂的产品就赶紧把Github账号注销回老家种地吧。谢谢❤️


顺便可以订阅一下是个人就能看懂的葬AI的 funeralai.substack.com💓


(本文封面由ChatGPT 生成,纯人工写作


文章来自于"葬AI",作者 "罗子马"。

1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

5
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
IOS下载
安卓下载
微信群