近日,Stability AI 引领AI技术风潮,发布了其最新力作 Stable Diffusion XL Turbo(SDXL Turbo)。这一模型不仅是 SDXL 的升级版本,更引入了“对抗性扩散蒸馏技术(Adversarial Diffusion Distillation)”,将图像生成的迭代步骤从原先的 50 步缩减至仅 1 步,堪称“一次迭代即可生成高品质图像”。
SDXL Turbo:AI图像生成的巅峰之作
Stable Diffusion XL Turbo 最引人瞩目的特点之一,是其惊人的“一次迭代生成图像”能力,实现了“即时文字转图像输出”,并且保证了图像的高质量。
这一创新背后的核心技术是“对抗性扩散蒸馏技术”,通过将大型图像扩散模型作为“教师网络”,指导模型的生成过程。结合了“蒸馏技术”和“对抗训练”,其中“蒸馏技术”通过将大型模型的知识浓缩到更小的模型中,实现对知识的精炼,而对抗性训练则进一步改进模型,更好地模仿教师模型的输出。
技术突破:高效生成高品质图像
以往的模型蒸馏技术在效率和品质之间难以平衡,因为快速采样通常会降低输出品质。而 SDXL Turbo 通过“对抗性扩散蒸馏技术”取得了重要进展,实现了在高效生成高品质图像方面的突破。
官方对比了 Stable Diffusion XL Turbo 与多个不同的模型变体,包括 StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL。通过两项实验,其中第一个实验要求模型评估人员随机查看两项模型的输出并选择最符合提示词的图像,第二项实验与第一项实验大致相同,但模型评估要求选择输出图像品质最佳的一方。
实验结果表明,SDXL Turbo 在大幅降低运算需求的同时,仍能保持出色的图像生成品质。该模型单次迭代即可超越经过 4 次迭代配置的 LCM-XL,而 4 次迭代的 SDXL Turbo 也能战胜之前经过 50 步迭代配置的 Stable Diffusion XL。在 A100 GPU 上,计算 512x512 分辨率的图像,仅需 207 毫秒。
Stable Diffusion XL Turbo 的发布标志着AI图像生成技术的一次革命性飞跃。通过引入“对抗性扩散蒸馏技术”,SDXL Turbo 实现了高效生成高品质图像,为AI领域注入了新的活力。这一技术突破将在未来的人工智能发展中发挥重要作用,为更广泛的应用场景提供更为可靠的解决方案。