大家好我是歸藏(guizang),今天教大家制作现在最火的 AI 视频品类。
无论你是否关注 AI 最近肯定在不同的社交媒体上刷到了这类视频。
一个大猩猩或者其他动物对着镜头絮叨,要不就是各种虚构的历史事件的采访。
每一个点赞和播放都很高不管是在国内还是海外。
虽然很无聊但是刷到就看的停不下来,即使是我这种经常接触 AI 内容的人都是如此。
这种品类甚至都渗透到了广告和营销的领域。
ins 上有个牙医诊所每天都发广告,每个播放都只有几千,但是换成“大脚男孩”之后他的广告播放高达 56 万次!
有了 Veo3 之后 AI 视频的制作成本下降了非常多。
现在可能是你入门 AI 视频制作非常好的机会,只需要两次生成简单的合并两段视频,你的作品就已经完成了。
你可能以为上面这些视频的点子都是创作者自己想的,但我要告诉你,其实不是。
上面大部分爆火的 AI 视频几乎从构思到提示词到生成全是 AI 为主,人类需要做的事情只有挑选点子,生成和复制提示词而已。
所以这篇内容我不只会教你如何用视频模型,我还会教你用各种工具分析视频从而生成新的创意,给你提示词模板,让你从创意到生成全部自动化。
我这个流程其实接近工程化了,你甚至可以用来做视频 Agent 产品,先要个赞🩷不过分吧。
先来看两个我用这流程做的这类 AI 视频,首先是荒诞采访形式的海盗财报会议。
之后是一个给巨龙看守地牢的倒霉哥布林牛马的一天。
是不是很牛批!好了,从现在开始扔掉你的脑子,开搞!!!
首先我们要教的是如何分析视频和拓展创意,这里我用的 NotebookLM。
你是不是只用 NotebookLM 来分析有口播的 youtube 视频,但我要告诉你,Gemini 其实是能分析视频画面的,所以你可以让 Noteboolm 帮你分析任何 Youtube 爆款视频的创作形式。
你甚至可以往里面加入多个爆款视频一起交叉分析。
你需要做的第一步是打开页面,新建一个 NotebookLM 笔记本,在添加来源这里输入你找到的 youtube 爆款视频地址。
你可以在来源这里继续添加,我最后一次性添加了找到的四个 Veo3 做的爆款 AI 视频,两个是第一人称Vlog 形式的,两个是采访形式的。
然后就可以写提示词让 NotebookLM 开始分析了,这里我放上我的提示词改一下前面的部分可以套用到任何创意视频上。
这四个视频都是用谷歌新发布的 Veo 3 视频模型生成编排的,在 Youtube 非常火爆,详细分析每个视频的每一个分镜的台词和画面内容,然后总结爆火的原因。
可以看到 NotebookLM 分析的非常详细。
每个视频的分镜画面以及台词内容都输出了,同时对于这类视频爆火的原因分析的也非常好。
我看完对这些视频爆火的原因是有些感觉到,但是完全做不到 NotebookLM 分析的这么细致和完整。
Veo3 伪纪实爆款视频的万能公式:四大核心要素
核心引擎:巨大的“反差感” (Contrast Engine)
这是所有笑点的根本来源。视频的成功在于将两个完全不搭界的元素进行强行碰撞,从而产生荒诞的喜剧效果。
表现形式:“伪纪实”的沉浸感 (Authentic Format)
视频都采用了模拟真实记录的拍摄手法,让观众产生“这好像是真的”的错觉,从而使反差感更加强烈。
内容基石:利用“共同认知” (Shared Knowledge)
这些视频从不凭空创造世界观,而是巧妙地站在“巨人”的肩膀上,利用了观众已有的知识储备和刻板印象。
传播关键:极强的“职场/生活共鸣” (Relatable Complaints)
视频最“扎心”也最搞笑的部分,是把所有宏大的叙事都拉回到普通人的抱怨和吐槽上。
我们上面已经有了这类爆款视频的创作逻辑和分镜描述了,接下来我们需要让 AI 根据这些上下文帮我们拓展创意。
你可以打开任何一个你用的惯的 AI 模型,我这里用的还是 Gemini。
将刚才 Notebooklm 分析的结果发给他,然后跟他说:
我会发给你几个最近非常火爆的用 AI 视频模型生成的视频内容和爆火的原因,你需要结合这些内容给我一些类似第一人称 Vlog 形式的点子,详细描写每个分镜(8 秒)对应的环境和角色以及说话内容和语气,适当插入打破第四面墙的说话方式,比如要赞。
这里我们首先做的是第一人称 Vlog 形式的视频。
这里的文案可能和内容可能我们生成提示词到时候并不会用,但是依然要让他输出是因为需要用详细的分镜内容和口播文案来判断创意的质量,不能只依赖标题和简单的描述。
之后你就可以根据他输出的点子内容进行挑选,首选比较好实现和偏现实题材的,这样生成的效果比较好。
这里我选了哥布林牛马这个,感觉反差感很强,在《龙与地下城》这种宏大视觉观的小角色视角。
在虚构采访这里我选用了海盗年会和金融行业黑话这个点子,反差感也很足,也会让打工人很有共鸣。
如果你对某个分镜感觉有需要修改的部分可以让他重新修改,直到内容你就的没问题。
这里我偷懒了,没有改直接进入了下一步,开始生成提示词。
这部分就比较简单了,我会给你第一人称 Vlog 和采访两个方案的提示词模板。
让 AI 基于刚才讨论的结果和提示词模板输出每个分镜的提示词就行。
到这一步,基本上我们的前期准备工作就结束了。
因为 Veo3 强大的提示词遵循和稳定性以及音频生成能力,我们可以直接跳过图生视频的图片生成、语音生成、唇形同步、音效匹配这几步。
如果以前要做类似的视频你可以想象要多麻烦,上面跳过的每一步都有可能出问题导致增加好几倍的工作量。
接下来我们就可以生成视频了,如果你想简单点搞定,我推荐你开个 Gemini Pro 会员,在 Gemini 里面生成。
直接进入到 Gemini APP 里面,选中输入框下面的视频按钮,输入提示词然后回车就行。
如果你不怕麻烦的话可以用 FLOW (labs.google/fx/zh/tools/flow/)这个谷歌专门用来视频生成的产品。
详细的教程我之前写过《Veo3和FLOW一手实测:谷歌这次成了,这次视频创作可能彻底变天》,这里就写一下简单的。
进来以后先创建项目,然后在输入框设置这里把模型调整到 Veo3 Fast 模型,这个很便宜。
不要再因为没切换模型,跑来问我为啥视频没声音了!
如果你追求质量可以用Quality 模型,但很贵。然后输入提示词等待生成就行。
如果这里下载的时候可以选择将生成的结果超分成 1080P,视频会清晰一些。
到这里我们基本上全部都 OK 了。
最后就是把视频合起来了,由于 Veo3 生成的视频基本就是完整的,你只需要用剪映或者其他工具把多端视频拼接然后导出就行,这应该都会做吧。
如果是英文的话可以点上面的字幕让剪映帮你自动生成一个字幕。
如果你还需要增加一些沉浸感的话可以加一些装饰,比如像我这个海盗年会一样加了一些类似电视台新闻直播都有的台标和文字滚动新闻。
在一个月前我 Veo 3 的测评文章里面就说过,“每一次Agent的模型化即使每个部分的模型本身质量没有升级也会带来非常多的应用场景和新的产品机会”。
现在回看我这个预言是不是算成真了,最近几乎每天都有基于 Veo3 制作的视频爆款产生,而且不断向不同的视频品类扩散。
AI 视频制作过程每少一步对于创作者基本盘的拓展就不止 10 倍这么简单,很多人有很好的点子和流量嗅觉只是因为技术和对 AI 的了解不够,所以没办法生产内容。
Veo3 生产成本已经很低了,如果出现视频类 Agent 把视频字幕之类的包装工作搞定,AI 视频生产者又何止百倍。
我们今年或许就能看到这一天的到来。
文章来自于微信公众号“歸藏的AI工具箱”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales