Stable Diffusion AI绘画创意与实战
上QQ阅读APP看书,第一时间看更新

1.1.2 Stable Diffusion的发展

Stable Diffusion是一种基于潜在扩散模型的深度学习文本到图像生成模型,能够根据任意文本输入生成高质量、高分辨率、高逼真的图像,如图1-1所示。

图1-1

2022年7月,Stable Diffusion问世,其是由创业公司Stability AI与多个学术研究者以及非营利组织合作开发的一种潜在扩散模型。

Stable Diffusion在算法上基于2021年12月提出的潜在扩散模型(LDM / Latent Diffusion Model)和2015年提出的扩散模型(DM / Diffusion Model)。

2022年8月,Stable Diffusion的源代码和模型都已经开源,在GitHub网站上由AUTOMATIC1010维护了一个完整的项目,正在由全世界的开发者共同维护。由于网址对网络有一些众所周知的需求,国内有多位开发者维护着一些不同版本的封装包,例如Coder软件。Coder为Stable Diffusion的普及作出了不可磨灭的贡献。

2023年4月,Stability AI发布了Beta版本的Stable Diffusion XL,并提到在训练结束且参数稳定后会开源。这一版本改善了需要输入非常长的提示词(prompt),能够用更短的提示词来创建更具描述性的图片。这个模型是图片生成能力的一次重大的进步,提供了增强版的图片构图和人脸生成技术,以便于获得令人震惊的视觉和艺术体验。