FLUX.1 Kontext案例教程,这次真的解决主体一致性了

搜索
AI-TNT
正文
资源拓展
FLUX.1 Kontext案例教程,这次真的解决主体一致性了
2025-06-02 17:20

嗨大家好!假期愉快!


5月29日,黑森林实验室发布了 FLUX.1 Kontext,目标是通过一个统一的框架处理多种图像任务,解决现有模型在多轮编辑中的一些关键痛点。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


先说结论:可以解决一些,但解决得还不够,但如果继续优化完善,未来还是可以对工作效率有帮助的。


官方介绍与我的个人感受:


1.统一的编辑与生成能力:FLUX.1 Kontext 使用单一模型即可完成多种任务。


包括在保留背景的情况下修改物体(局部编辑),以及根据一张参考图将角色置于全新场景中(上下文生成)。


2.出色的角色一致性:能在连续、多轮的编辑中保持人物或物体外观的高度一致性。


这对于创作故事板、系列图片或任何需要角色连贯性的应用来说,可以说是重大利好了。


根据评估数据以及我的实际测试,在人物、物体相似度保持方面,它的表现对比其他工具确实很不错。


3.交互级的生成速度:FLUX.1 Kontext 的速度非常快,生成一张 1024x1024 分辨率的图片仅需3-5秒。


我这次使用的Apple M4 Max的Mac Studio,测试每张图出图速度平均在10秒左右。


4.支持迭代式工作流:用户可以通过连续的指令对一张图片进行多次“微调”,而不会出现明显的质量下降或视觉漂移,从而实现更精细的创意控制。


但迭代多了细节上还是有伪影,和图像质量和细节的损失。


总的来说,它现在可以直接修改主体和细节,可以将图片变成其他风格,可以将这种风格作为参考应用在生图中,可以替换背景不改变主体,


可以修改文本内容但是保持文字风格一致(目前只支持英文),可以将前面我列举的功能结合起来使用。并且它能保持很好的一致性和很强的风格迁移能力。


我们可以在这里免费体验(外国网站),有赠送200积分:https://playground.bfl.ai/image/edit


或者在ComfyUI中使用:https://www.comfy.org/zh-cn/


具体ComfyUI中使用的步骤我留在后文讲。


然后在其他的一些平台也可以使用:KreaAI、Freepik、Lightricks、OpenArt 和 LeonardoAI平台都支持FLUX.1 Kontext [max] 和 FLUX.1 Kontext [pro]了。


1.物体修改


官方提示建议:将 [物体] 改变为 [新状态],保持 [保留内容] 不变


改变汽车的颜色,人物主体还还是不错的,不过直接把虚化模糊的车都变清晰了怎么回事:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝

Character remain unchanged, the cars in the background remain unchanged, change the car‘s color to red.


角色保持不变,背景中的汽车保持不变,将汽车的颜色改为红色。


这里我修改了人物手中的物体和文字部分,可以看到首先一致性保持得不错,然后字体也是完全还原了原始字体,可惜目前不支持汉语。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝Replace the toothbrush in the hand of the main character on the left with a microphone,


making the character look like they are singing. Change the text content to "Singing, louder, more noise."


将左侧主角手中的牙刷替换为麦克风,让角色看起来像在唱歌。将文字内容改为"唱歌,更大声,更多噪音。"


这里我将一个卡通盲盒IP的角度让它进行修改,注意看整体的细节,


无论是面部、珍珠数量细节,海底背景,泡泡,甚至左上角的AI标志都很好地保持了原样没有改变。


最后更换发色也非常和谐,除了发色其他地方基本没有改变。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝1.原图


2.Keep the background unchanged, the character is sideways facing the audience.保持背景不变,角色侧向观众


3.Maintain the background as is; the character is facing away from the audience.


保持背景不变;角色背对观众。


4.Maintain the background as is;The mermaid's hair changes to red.


保持背景不变;美人鱼的头发变成红色。


一致性保持得好可以做的就比较多了,比如帮你去掉不喜欢的同事:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝Maintain all other characters and scenes unchanged, remove the man in the center, and replace him with a bonsai.


保留所有其他角色和场景不变,移除中间的男人,将其替换为一盆盆栽。


如果你不喜欢人,可以帮你全都去掉(假期游客照有救了),再替换个热情似火的背景。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝Remove all passerby from the background, change the background to a volcanic crater.


从背景中移除所有路人,将背景更改为火山口。


2.风格迁移


官方提示建议:转换为 [特定风格],同时保持 [构图/角色/其他] 不变


首先试一下将一张图片迁移为其他风格。在这方面我个人认为细节上还是稍稍不如4o的,但是也还不错。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝Transform the style into a watercolor style, cute, keeping the characters and background unchanged.将风格转换为水彩风格,可爱,保持角色和背景不变。


Change the style to Japanese Ghibli style, keeping the characters and environment unchanged.将风格改为日本吉卜力风格,保持角色和环境不变。


Change the style to cartoon 3D clay texture style, keeping the characters and environment unchanged.将风格改为卡通3D粘土质感风格,保持角色和环境不变。


Convert the style to a 16-bit mosaic pixel style, keeping the main character and background unchanged.将风格转换为16位马赛克像素风格,保持主角和背景不变。


或者我给一张指定风格的照片,Kontext参考风格,迁移风格,生成其他场景。


一致性细节真的很好,比如我第一张图肩膀上有奇怪的肩带,这个人物身上的带子在延展其他图片的时候依然存在哈哈哈:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝1.原图


2.保持原始画面风格,清晨的江南小巷,刚被雨水冲刷过。一个纸鸢缠绕在电线杆上,屋檐下挂着一个竹篮,巷尾的茶馆刚刚开门,温暖的灯光从里面洒出。


3. 保持原始画面风格,一位穿着深绿色旗袍的女子撑着伞走进雨中的小巷,脸上带着淡淡的思索表情。


她穿过灰砖和瓦屋顶,雨滴轻轻地拍打着她的伞,路旁的灯笼随风轻轻摇曳。


4. 保持原始画面风格,镜头拉近到屋檐的一角,那里有一只小鸟,给小鸟一个特写镜头。


5. 保持原始画面风格,她经过一家裁缝店,橱窗里挂着未完成的布料。一只猫在门旁的踏板上打盹,而店内,一位老人专注地缝制着,每一针都一丝不苟。


6. 保持原始画面风格,镜头拉近,给左下角睡着的猫一个特写镜头。【镜头拉近这个效果很好用,后续可以在首尾帧或者连续镜头中使用。】


7. 保持原始画面风格,她在老街尽头的一家邮局前停下,从包里取出一封旧信。背景是潮湿的格子窗和一个斑驳的门牌;信封的边缘有些破损。


8.保持原始画面不变,环境变成夜晚。


或者为角色图延展相同风格的环境图(下方上面这张是Midjourney y生成的,我个人感觉美学和质感上Kontext 比起来还是稍微有一些差距的):


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝Using this style, depict a glowing meadow on the ocean floor, filled with soft sea anemones and dreamlike bubbles rising through spirals of light.


The ground is dotted with ancient stone rings and smooth white pebbles that pulse faintly with color. In the background,


and a school of silver fish forms a perfect spiral as it swims by, leaving behind a trail of glittering particles.


使用这种风格,描绘海底发光的草地,充满柔软的海葵和梦幻般的气泡,通过螺旋光线上升。地面点缀着古老的石环和光滑的白色鹅卵石,微弱地闪烁着色彩。


在背景中,一群银鱼游过时形成完美的螺旋,留下闪闪发光的粒子轨迹。


3.背景替换


官方提示建议:将背景改为 [新背景],保持主题在完全相同的位置和姿态


原本只想做背景替换,但是感觉有点无趣,就把人物一致性一起放里面测试了,


每次可以改动,但是不能改动太多,调整次数也不能太多,到后面面部整体细节会有影响。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝1.原图


2.(参考图1)Keep the face completely unchanged. Position the subject for a passport-style headshot. Use a plain light grey or white background,


even frontal lighting, and neutral facial expression. Hair neatly arranged, no shadows. Center the face in the frame.


3.(参考图1)Keep the facial features and expression unchanged. The person is not looking at the camera, a full profile shot.


4.(参考图1)1️⃣Keep the facial features and expression unchanged. Place the subject beside a colorful supermarket shelf, under bright fluorescent lighting.


Use a wide-angle lens with a slight distortion. Capture a side profile with sharp detail, maintaining a lifestyle and candid feel.


2️⃣The character setting and background remain unchanged, The person is facing the camera and laughing.


(这里跑了2次,有一个过渡,人物-人物在超市-人物在超市,带笑表情。一次跑出来的效果可能不理想,遇到相同要求可以参考这个)


5.(参考图4)The character setting and background remain unchanged, The person Holding a bottle of cola up to the camera.


6.(参考图3)Preserve facial structure. The subject Wearing a grey T-shirt and jeans.sits indoors near a large café window.


Shoot from outside through the glass, capturing the reflection layered over the face. Use a soft-focus depth and warm interior lighting.


Composition is intimate and poetic.


7.(参考图6)Preserve facial structure.The character is playing the guitar, her gaze is lowered towards the guitar, leaving the back of her head for the audience,


and the camera zooms in.


8.(参考图6)Preserve facial structure. at night,The girl is holding a birthday cake in her hand, looking towards the camera,


with an extreme close-up, focusing on her facial expression, which is happy and relaxed.


9.(参考图3)Keep the face completely consistent. The character has short hair, using standard passport photo front-facing half-body composition,


with a pure gray or pure white background, even lighting without shadows, natural and upright facial expression, neat hair, and centered facial alignment.


(这段内容太多了就不翻译了,大家需要可以自行翻译)


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝1.原图


2.(参考图1)The characters maintain the same facial features and hairstyle, with a sweet smile indicative of being in love.


角色保持相同的面部特征和发型,带着陷入恋爱中的甜蜜微笑。(这里直接给我加了个女孩哈哈哈)


3.(参考图1)The background changes to a Tokyo night scene, and the character is wearing a white T-shirt.


背景改为东京夜景,角色穿着白色T恤。


4.(参考图5)The character has a clean face and laughs out loud at the camera.


角色面部干净,对着镜头大笑。


5.(参考图6)Maintain the background unchanged, the character turns around, leaving a back view.


保持背景不变,角色转身,留下背影。


6.(参考图6)Maintain the background unchanged, the character rides on a motorcycle, wearing a pink motorcycle helmet with a cute Carrot sticker on it.


保持背景不变,角色骑着摩托车,戴着一顶带有可爱胡萝卜贴纸的粉色摩托车头盔。


再比如大家比较熟悉的老演员毛毛小狗的快乐一天,这次色调和材质都对上了,也没有发黄(没错,我在阴阳4o):


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝1. 原图


2.(参考图1)Keep the background unchanged, the character is facing away from the camera.保持背景不变,角色背对镜头。


3.(参考图1)Maintain the setting of the main character Shiba Inu.The Shiba Inu raised its right paw to put on sunglasses for itself.保持主角柴犬的设定。


柴犬抬起右爪为自己戴上墨镜。


4.(参考图3)Maintain the setting of the main character Shiba Inu.The Shiba Inu is sitting in the car driving.保持主角柴犬的设定。柴犬坐在车里开车。


5.(参考图1)Keep the character and material settings the same, but replace the background with a cyberpunk-themed bar.


The character raises a mint-colored cocktail in their hand.保持角色和材质设定不变,但将背景替换为赛博朋克主题的酒吧。角色手中举着一杯薄荷色的鸡尾酒。


6.(参考图5)Keep the character and material settings the same,


The Shiba Inu was drinking, A huge red panda was added on the right, the red panda and the Shiba Inu have the same character style,


and the red panda is drinking orange juice.


保持角色和材质设定不变,柴犬在喝酒,右侧添加一只巨大的小熊猫,小熊猫和柴犬具有相同的角色风格,小熊猫在喝橙汁。


4.文本编辑


官方提示建议:将 '[原文]' 替换为 '[新文]',保持相同的字体样式


保持相同字体样式它是做得很好的,但是考虑它只能延伸英语的,这里就不做过多展开了,大家可以看看效果,字体样式确实保持得很好。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝Replace "fief" with "Irene." Keep the same font style.


将 "fief" 替换为"Irene."保持相同的字体样式


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了



📝Keep the font style unchanged, replace "Redefine Your Weekend" with "Procrastinate Professionally";


Replace "Break away from toxic work culture and embrace two days of conscious rest and recharge."


with "Call it 'self-directed learning' while rewatching cat videos and Googling 'how can focus.'"


保持字体样式不变,将“Redefine Your Weekend(重新定义你的周末)”替换为“Procrastinate Professionally(专业拖延)”;


将“Break away from toxic work culture and embrace two days of conscious rest and recharge.


(摆脱有害的工作文化,拥抱两天有意识的休息与充电。)”替换为“Call it 'self-directed learning' while rewatching cat videos and Googling 'how can focus.'


(把反复看猫咪视频和搜索“如何集中注意力”称为“自我主导学习”。)”。


5.其他补充


5.1 产品换背景


然后还想补充一点例如产品和IP方面的。比如,假设我有个可乐素材(仅供学习交流,内容与品牌无关)可以做一些背景和文字的改变。


但是目前似乎做不了风格过于明显和突出的,如果这样做就会被频繁报错,说改动幅度太大:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝1.原图


2.A vintage American diner scene from the 1950s, with checkered black and white floor tiles, shiny red leather booths, and a glowing neon sign reading "Cold


Drinks" in the background. Sunlight streams in through large glass windows, creating reflections on the glass Coca-Cola bottle standing on a glossy chrome


counter. The unopened bottle is covered with condensation droplets, and next to it lies a bottle opener and a red-and-white napkin. Warm ambient lighting adds a


nostalgic and inviting atmosphere.


1950年代的美式复古餐厅场景,黑白格子地板砖,闪亮的红色皮革卡座,背景中有一个发光的霓虹灯牌写着"Cold Drinks"。


阳光透过大玻璃窗洒进来,在放置于光亮镀铬柜台上的玻璃可口可乐瓶上形成反射。


这瓶未开封的瓶子表面布满凝结的水珠,旁边放着一个开瓶器和一张红白相间的餐巾纸。温暖的环境光线营造出怀旧而诱人的氛围。


3.Keep the drink bottle unchanged. The bottle stands on cracked earth, while floating islands drift slowly in the sky above.


保持饮料瓶不变。瓶子立在龟裂的土地上,而浮空岛屿在上方的天空中缓缓漂移。


4.The subject remains unchanged, the text style remains unchanged, and the text is modified to "Cool Irene".


主体保持不变,文字样式保持不变,文字修改为"Cool Irene".


5.2 局部细节


或者当我有一张人物着装照片,可以直接让Kontext提取出服装为平铺效果,也可以在平铺效果的基础上再将镜头拉更近体现织物细节。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝1. 原图


2.(参考图1)no people, extract only the coat over a white background, product photography style.


无人物,仅提取外套置于白色背景上,产品摄影风格


3.(参考图2)show me an extreme closeup of the fabric 给我展示布料的极近特写


5.3 三视图


IP方面,可以让它直接输出三视图(这里的三视图是一次性成功的):


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝1.原图


2.(参考图1)The character remains the same; girl stands Standing on the floor.against a backdrop of pink plaid, with a display of tableware behind him.


角色保持不变;女孩站在地板上,背景是粉色格子布,身后展示着餐具。


这张图有个过渡图,去掉了底座,也损失了一些细节,比如围裙上的草莓纹理细看是有点不一样的。


3.Output front view, side view, rear view. 输出正视图、侧视图、后视图。


这里输出图的比例为设置为了4:1,设置3:1也可以,但是也不会是非常规矩的三个正方形,比较随机。


5.4 多图参考


目前比较难直接多图参考,但是有个妙计,先把需要的多图拼起来。谢谢@AI炼丹师忠忠教我的技巧哈哈。


比如下面图一是原图(两张图的拼图),图二是输出图。但是这招目前出现问题的几率比较大。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


📝Keep the scene from the above image unchanged and insert the character from the below image into the scene of the above image.


保持上图的场景不变,让下图的人物出现在上图的场景中。


使用平台1:FLUX Playground


链接(有200积分免费额度可体验):https://playground.bfl.ai/image/edit


生成功能:这个和一般工具的生成功能基本是一样的。这里不展开讲了。


编辑功能:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


Batch Size 批处理大小


  • 值:1-4张


  • 数值越大,一次输出的图越多。节约积分建议可以为1-2。


Safety Tolerance 安全容错


  • 值:0-6


  • 含义:模型的安全策略容忍度,通常控制对不当内容的敏感程度,数值越大生成内容范围越广,数值更小可防止生成 NSFW 或冒犯性图像。


Prompt Upsampling 提示上采样


  • 含义:指增强关键词影响力或提升对 prompt 的理解分辨率。开启后可能会使提示词中的主元素更突出,但也可能导致图像构图过度集中。


Output Format 输出格式


  • 输出格式:PNG/JPEG


  1. Seed 种子


  • 含义:控制图像生成的“随机性种子”。


  • 按下 "Random" 每次都会生成不同图。


点击小箭头图标发送,稍等一会儿就可以看到输出的图片:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


可以看到皮肤细节和整体色调稍微有所改变(可能是为了适应环境),但是人物整体和面部细节保持得非常好,和环境融合也很自然。


填充功能:


选择要填充的位置,然后在下方描述填充位置的元素:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


扩图功能:


比如上传一张图,调整这张图的大小,然后在下方可以加入对扩展部分的描述。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


使用平台2:Comfy UI客户端使用


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


使用需要购买API,支持微信支付和支付宝支付。在设置中可以找到积分余额和充值渠道。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


然后简单看看工作流:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


aspect_ratio(宽高比)


  • 图像输出的长宽比,3:2 通常表示例如 768×512 这样的尺寸(宽大于高)。如果为了对比效果更明显,可以设置和原图比例一致。


  1. guidance(提示引导系数)


  • 数值默认3.0,这里可以维持3。


  • 含义:提示词引导强度,也叫 CFG(Classifier-Free Guidance)值。


  • 越高表示模型越依赖提示词(更“听话”),但过高可能失真或不自然。常见范围:1.5–7.5,一般 2–4 较为平衡。


2.steps(采样步数)


  • 数值默认50


  • 含义:采样步数,指扩散模型反向去噪的次数。步数越多,图像质量可能更好,但也更耗时;20–50 属于正常范围。


3.seed(随机种子)


  • 生成图像时所用的随机数种子。


  • 可用于复现图像或用于做对比实验。


4.control_after_generate(生成后控制)


  • 包含了控制/增加/减少/随机选项。主要是控制在每次图像生成完成后,是否自动改变关联组件的值,


常见用途是自动更换种子(seed),以便下一次生成出不同的图像。


  • 默认选项:randomize,正常使用的时候不用修改。


  • 不同模块会有不同处理逻辑,具体含义需看你的workflow使用了哪个control模块(如 ControlNet、T2I-Adapter)。


5.prompt_upsampling(提示词放大)


  • 默认选项:false。


  • 关闭:完全按你输入的提示词执行,结果可复现,更可控。


  • 打开:自动增强提示词语义,可能加入创意变化,结果不可复现。


上面的参数最简单易懂的方式就是打开以后只调整图片比例,其他全部保持不变。


另外,jpeg格式的图片可能会无法预览(我是Mac版本,不确定其他版本会不会也无法预览),比如即梦的下载图片上传进去就不可以预览,但是可以工作。


png和jpg可以预览。


以及,Freepik我之前体验了下,只找到生图的区域,没找到编辑的,如果有朋友知道的可以评论区留言我们一起交流下。


其他平台我目前还没有体验,后续如果有效果更好工作流更科学的平台我再推荐给大家。


📝关于FLUX.1 Kontext的pro与max版本怎么选:


FLUX.1 Kontext [pro]:速度更快,质量细节略逊于max版,单张0.04美金(Comfy UI客户端价格),性价比更高。


FLUX.1 Kontext [max]:耗时更长,图片质量更好,图像保真度和细节表现力更优秀,单张0.08美金(Comfy UI客户端价格)。


此外他们还有开发了一个开放权重版本,FLUX.1 Kontext [dev],是一个轻量级的 12B 扩散 Transformer,适合定制且与之前的 FLUX.1 [dev]推理代码兼容。


这个是以私人测试版的形式开放 FLUX.1 Kontext [dev],用于研究和安全测试。如果感兴趣,可以联系 kontext-dev@blackforestlabs.ai


总的来说,目前存在的问题与不足如下,在黑森林实验室的论文中也提到了目前模型的局限性:


1.多轮编辑后质量退化。在进行过多的、连续的多轮编辑后,模型生成的图像可能会出现视觉瑕疵或伪影,导致图像质量下降。


2.指令遵循的准确性。少数情况下,模型可能无法完全准确地遵循用户的指令,有时会忽略或误解提示中的特定要求 。


3.世界知识有限。模型的“世界知识”仍然有限,这可能会影响它生成特定上下文或事实性内容时的准确性。


4.蒸馏过程引入的瑕疵:模型训练中采用的蒸馏技术(distillation process)本身也可能引入一些视觉上的瑕疵,从而影响输出图像的最终保真度。


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


我个人实测后,目前发现存在的问题不足有:目前大部分可使用它的平台无法参考多图像,无法使用知名IP


(这个也不算问题,但是拿知名IP玩梗是不太行了哈哈),无法改变过多元素,动作过大会报错,表情情绪不够强烈,


实际上在修改后还是有微小细节的调整(比如细微角度或者镜头远近等)。


建议:如果要你的目的是既要改变场景又要改变角色动作,可以先跑一次换一个部分,然后再换另一部分,比如先换场景再换动作。


另外,提示词不要太长,修改的地方多了就容易报错。如果原图比较规规矩矩,就可能比较难做出视觉冲击比较大的修改。


下面是官方给出的提示词输出建议(这里翻译成中文版了):


### 1. 基本修改
- 简洁直接:`"将汽车颜色改为红色"`
- 保持风格:`"改为白天场景,同时保持画面的同一风格"`

### 2. 风格迁移
**原则:**
- 明确命名风格:`"转换为包豪斯艺术风格"`
- 描述特征:`"转换为有可见笔触的油画,厚重的油漆质感"`
- 保持构图:`"改为包豪斯风格,同时保持原始构图不变"`

### 3. 角色一致性
**框架:**
- 具体描述:`"短发黑发的女人"` 而不是 "她"
- 保持特征:`"同时保持相同的面部特征、发型和表情"`
- 步骤修改:先改变背景,然后是动作

### 4. 文本编辑
- 使用引号:`"将 '快乐' 替换为 'BFL'"`
- 保持格式:`"替换文本,同时保持相同的字体样式"`

## 常见问题解决方案

### 角色变化过大
❌ 错误:`"将人物变成维京人"`
✅ 正确:`"改变服装为维京战士,同时保持面部特征不变"`

### 构图位置变化
❌ 错误:`"把他放在海滩上"`
✅ 正确:`"改变背景为海滩,同时保持人物在完全相同的位置、比例和姿态"`

### 风格应用不准确
❌ 错误:`"使其成为素描"`
✅ 正确:`"转换为铅笔素描,具有自然的石墨线条、交叉阴影和可见的纸张质感"`

## 核心原则
1.**具体明确** - 使用精确的描述,避免模糊的术语
2.**逐步编辑** - 将复杂的修改分解成多个简单的步骤
3.**明确保留** - 说明应保持不变的内容
4.**动词选择** - 使用 "改变"、"替换" 而不是 "转换"

## 最佳实践模板
**物体修改:**
`"将 [物体] 改变为 [新状态],保持 [保留内容] 不变"`

**风格迁移:**
`"转换为 [特定风格],同时保持 [构图/角色/其他] 不变"`

**背景替换:**
`"将背景改为 [新背景],保持主题在完全相同的位置和姿态"`

**文本编辑:**
`"将 '[原文]' 替换为 '[新文]',保持相同的字体样式"`

> **记住:** 越具体越好。Kontext 在理解详细指令和保持一致性方面表现卓越。


前面特别多记不住,那就记得三点:


📝1. 提示词的核心:输入哪些不要变,哪些要变。


2. 一次变不了太多,每次改变一部分。


3. 提示词使用英语。(我尝试的是 ComfyUI 的客户端,大家如果有使用中文有同样效果的平台可以在下方留言告诉我,感谢!)


最后附上论文原地址,有感兴趣的朋友可以看一看:https://cdn.sanity.io/files/gsvmb6gz/production/880b072208997108f87e5d2729d8a8be481310b5.pdf


最后还有一个彩蛋哈哈哈,是使用Kontext制作的图片,vidu制作的视频,阿真版·瞬息全宇宙:


FLUX.1 Kontext案例教程,这次真的解决主体一致性了


好了,今天的分享就到这里啦,希望这期的内容对大家有帮助~


文章来自于微信公众号 “阿真Irene”,作者 :宝藏同学阿真


FLUX.1 Kontext案例教程,这次真的解决主体一致性了

1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

IOS下载
安卓下载
微信群
沪ICP备2023015588号