Article

Training-Free Single-Image Diffusion Models

Ein neuer Forschungsansatz ermöglicht Diffusion-Modelle aus einem einzigen Referenzbild – ohne Training.

Das Konzept: Statt ein neuronales Netz auf einem Einzelbild zu trainieren (stundenlang, rechenintensiv), modellieren die Forscher das Bild als Dataset seiner Patches auf verschiedenen Skalen. Da der Patch-Datensatz endlich und niedrigdimensional ist, kann die Score-Funktion analytisch berechnet werden.

Die Innovation: Ein optimaler, geschlossener Denoiser eliminiert die Notwendigkeit für Netz-Training. Das Verfahren erreicht State-of-the-Art-Qualität und Diversität verglichen mit trainierten Single-Image-Diffusion-Modellen.

Anwendungen:

  • Unkonditionelle Bildgenerierung
  • Text-geführte Stilisierung
  • Bild-Symmetrisierung
  • Retargeting

Performance: Megapixel-Generation in einer Sekunde, Gigapixel in Minuten – dank Latent-Space-Kompatibilität und zusätzlicher Beschleunigungstechniken.

Die Arbeit verbindet klassische Patch-basierte Bildrestauration mit moderner Diffusion.

arXiv:2606.04299 | CVPR 2026