阿里发布QwenImageEdit免费开源AI修图最强平替
阿里通义千问又来整新活了。
8 月 19 日,阿里通义千问团队正式发布 AI 图像编辑模型 Qwen‑Image‑Edit 。
不同于此前 20B 参数的 Qwen‑Image 生图模型, Qwen‑Image‑Edit 主打“修图”,即图像编辑,可以类比 OpenAI 的 GPT Image 原生生图模型。
根据阿里官方介绍, Qwen‑Image‑Edit 支持中英双语文字的精准编辑,并融合语义级(整体理解与自然语言编辑)与外观级(细节精修与局部控制)的双重图像编辑能力。
这意味着, Qwen‑Image‑Edit 不仅可以修改海报上的一行小字:
也可以进行人物视角转换,90°、180° 都可以。
01|从“生成”到“可控编辑”
相比传统扩散模型专注于从零生成图像,图像编辑对模型提出了更高要求:不仅要理解图像的语义,还需具备精细重构的能力。
Qwen‑Image‑Edit 在架构上引入“双模块”机制,通过语义与外观两个维度的协同控制,实现既精准又风格统一的图像修改。
语义控制 :由 Qwen2.5‑VL 模块负责,确保编辑符合图像原有的语义逻辑
外观控制 :通过 VAE Encoder 保留图像的风格细节,避免非目标区域受到干扰
同时, Qwen‑Image‑Edit 继承了 Qwen‑Image 在中英文文字渲染方面的原生优势,擅长处理排版复杂、文字密集的内容,如中文段落、混排标语。
02|三类核心编辑能力
基于上面的技术原理, Qwen‑Image‑Edit 共有三类核心能力。
中英文字精准编辑
你可以对图像中的中文或英文文字进行 增、删、改、换颜色 等操作,且模型会保留原有排版、字体、字号与风格。
比如:
修正书法作品中的错别字
修改宣传海报中的小字说明
调整英文封面中的单词与颜色
支持“链式编辑”,即用框选方式逐步完成复杂多步精修。
语义级图像改写
Qwen‑Image‑Edit 支持保持语义一致性的前提下,大幅度改变图像视觉内容。
所以,它很适合:
IP 创作 :同一角色多样风格/动作变化
视角变换 :支持 90° / 180° 人物转向
风格迁移 :如将头像变为“宫崎骏风格”或“国风水墨”
适用于创意设计、IP 拓展、图像表达再创作等场景。
比如 Qwen 给自己创作的 IP 矩阵,萌萌哒。
外观级局部修饰
对图像中的局部进行细致调整,确保非目标区域完全不变。
支持:
添加物体(如“加一个站牌 + 自动反射”)
删除杂物(如“去除头发丝、背景干扰”)
局部色彩替换(如“把 logo 中的 n 变蓝色”)
这类操作适用于视觉审美优化、品牌统一化设计等需求。
03|如何体验与调用?
在线(推荐):
Qwen Chat :https://chat.qwen.ai/?inputFeature=image_edit
Hugging Face Spaces :https://huggingface.co/spaces/Qwen/Qwen-Image-Edit
API 调用:
调用地址 :https://www.alibabacloud.com/help/en/model-studio/qwen-image-edit-api
模型名: qwen-image-edit
API 定价:$0.045 /张;免费额度 100 张(180 天有效)
04|Qwen‑Image‑Edit 实测
从官方给出的案例来看, Qwen‑Image‑Edit 还是很有实力的。
实测一波。
提示词:优化公众号 AI信息Gap 的头像,风格简洁现代,突出科技与未来感,体现人工智能和信息连接主题。采用冷色调(蓝色、银色),可加入电路、数据流、光效等抽象科技元素,整体专业且辨识度高。
附上优化前后的头像对比。
左边是原图,右边是 Qwen‑Image‑Edit 优化的头像。
整体来看表现还算不错。文字编辑是 Qwen‑Image‑Edit 的优势之一,这次实测中也体现得比较明显。指令响应和风格保持也还过得去,比如虚拟人头的轮廓与形状保持了一致性。
结语
作为一个 20B 参数的模型, Qwen‑Image‑Edit 的表现“可圈可点”。
真要让它和 OpenAI 的 GPT Image ,以及疑似谷歌的神秘模型 nano-banana 相比,可能还有点牵强。
版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/163.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论