通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力
3 天前 / 阅读约1分钟
来源:凤凰网
通义千问Qwen推出Qwen-Image-Edit,基于20B的Qwen-Image模型,将文本渲染能力延展至图像编辑,兼具语义与外观的双重编辑能力。

凤凰网科技讯 8月19日,通义千问Qwen宣布推出Qwen-Image-Edit,Qwen-Image的图像编辑版本。

Qwen-Image-Edit基于20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。

此外,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),从而兼具语义与外观的双重编辑能力。