今天 OpenAI 发布了最新的AI语言模型 ChatGPT4.0,因为国内暂时无法测试,所以也只能从 OpenAI 发布的官方新闻中一窥究竟了。
从官方新闻来看,ChatGPT4.0 最大的改善就是已经成功进化成为了一种多模态的AI模型,不仅支持语言内容,也开始支持图像内容。
而作为 OpenAI 最大的潜在竞争者,Stability.AI 旗下的 AI绘画模型 Stable Diffusion 依靠开源社区内4500万应用者,也在加速其工业化的进程。
今日,一款全新的,区别于一般用户所使用的WebUI(网页操作界面)之外的,重度工业化的 AI绘画操作平台,已悄然浮出水面,它就是 ComfyUI 。
ComfyUI 的理念就是利用强大的模块化节点界面,来重组 Stable Diffusion 的AI绘画流程。
可能听上去比较难懂,但实际上,简单来说,就是在 ComfyUI 的操作平台上,可以先绘制出超分辨率且使用不同模型的背景,然后再绘制出基于另一种模型的前景人物,然后还能继续通过渲染器,来统一渲染最终画面。
这些步骤的每一个过程,都可以选择使用不同的正反关键字、模型和风格。
再简单一点来说,也就是接近于 PhotoShop 的图片分层,每层都可以单独绘制,最后再合并处理。
当然,ComfyUI 的操作界面更加像是一种音频流混音器的直观模式,而非 PhotoShop 那样的快捷窗口模式。
Stable Diffusion AI绘图的工业化,很有可能将会以 ComfyUI 的形式来完成。
十多年前,就已经有人预测最早2025年,最晚2030年,AI技术必将进入奇点爆发期。
而在2023年,我们有幸可以亲眼目睹 ChatGPT 与 Stable Diffusion 的高速进化之路,也算是不枉此生了。
当然,相比日益封闭 OpenAI,个人更支持秉承 AI by the people for the people 为其开源理念的 StabilityAI,诸君以为呢?