图像界的DeepSeek!12B参数对标GPT-4o,5秒出图,消费级硬件就能玩转编辑生成
3 天前 / 阅读约2分钟
来源:凤凰网

图像模型开源还得是FLUX!

Black Forest Labs刚刚宣布开源旗舰图像模型FLUX.1 Kontext[dev],专为图像编辑打造,还能直接在消费级芯片上运行。

只有小小的12B,更少的参数,更快的推理,性能更是媲美GPT-image-1等一众闭源模型。

现在FLUX.1 Kontext[dev]可以让小狗迅速离开画面,为小老鼠戴上胡须,添加文字、修改背景也不在话下。

或者多次输入指令,直到让小哥成为酒吧里最靓的崽(bushi),直到让画面符合咱们需求。

具体来说,FLUX.1 Kontext[dev]的主要特点有:

可以根据编辑指令直接更改现有图像,以及进行精确的本地和全局编辑。

不用做任何微调,就能直接引用里面的人物角色、风格样式和物品元素。

允许用户通过多次连续编辑优化图像,同时将视觉漂移降到最低。

专门为NVIDIA Blackwell进行了权重优化。

网友们也立马上手试玩,制作了一个旅行的CPU青蛙?

旅行必备的墨镜,还有抗寒的帅气红色毛衣也要准备妥当。(蛙蛙:出片,我势在必行)

或者copy一下自己喜欢的动漫角色。

轻轻松松店铺打烊,结束打工人完美的一天~(doge)

还有网友脑洞大开,试着和LoRA结合,造出了一个Kontext风格化肖像制作APP。

现在FLUX.1 Kontext[dev]还完全支持ComfyUI。