重要论文与研究

Denoising Diffusion Probabilistic Models

Jonathan Ho, 2020 NeurIPS

这篇论文提出了去噪扩散概率模型(DDPM),为现代AI绘画的扩散模型奠定了基础。该模型通过逐步去噪过程生成高质量图像,已成为当前AI绘画领域的主流方法之一。

查看论文全文 →

High-Resolution Image Synthesis with Latent Diffusion Models

Robin Rombach等, 2022 CVPR

潜在扩散模型(LDM)通过将扩散过程应用于潜在空间而非像素空间,大幅降低了计算成本,实现了高质量、高分辨率图像的生成,是Stable Diffusion等流行模型的基础。

查看论文全文 →

Generative Adversarial Networks

Ian Goodfellow等, 2014 NeurIPS

这篇开创性论文提出了生成对抗网络(GANs),通过生成器和判别器的对抗训练生成逼真图像。GANs为AI绘画的早期发展奠定了理论基础,催生了大量后续研究。

查看论文全文 →

DALL-E 2: Hierarchical Text-Conditional Image Generation with CLIP Latents

Aditya Ramesh等, 2022 OpenAI

DALL-E 2结合CLIP模型和扩散模型,实现了从文本描述生成高度匹配、多样且逼真图像的能力。该模型展示了大规模多模态模型在AI绘画领域的巨大潜力。

查看论文全文 →

AI绘画主要研究方向

  • 生成模型架构:包括GANs、VAEs、扩散模型、自回归模型等不同的生成模型设计
  • 文本到图像生成:基于自然语言描述生成对应图像,如DALL-E系列、Stable Diffusion等
  • 图像到图像转换:将一种类型的图像转换为另一种类型,如风格迁移、图像修复、超分辨率等
  • 可控生成:通过条件控制(如草图、分割图、姿态等)指导图像生成过程
  • 评价指标与评估:研究如何客观评估生成图像的质量、多样性和真实性