ESRGAN (Enhanced Super-Resolution Generative Adversarial Networks) ist ein Deep-Learning-Modell, das für die Bildauflösung verwendet wird. Es basiert auf einem Paper von Wang Xintao et al., das 2018 veröffentlicht wurde.
ESRGAN ist ein Modell, das verwendet wird, um Bilder mit niedriger Auflösung in Bilder mit höherer Auflösung umzuwandeln. Dies geschieht durch die Verwendung von Deep Convolutional Neural Networks, die in der Lage sind, Bilder mit höherer Auflösung aus Bildern mit niedriger Auflösung zu rekonstruieren.
Die Architektur von ESRGAN basiert auf SRResNet mit residual-in-residual-Blöcken. Es verwendet eine Mischung aus Kontext-, Wahrnehmungs- und adversarialen Verlustfunktionen. Die Kontext- und Wahrnehmungsverlustfunktionen werden verwendet, um Bilder ordnungsgemäß aufzuskalieren, während die adversarialen Verlustfunktionen das neuronale Netzwerk dazu bringen, Bilder mit höherer Auflösung zu generieren, die natürlichen Bildern ähneln.
ESRGAN verwendet verschiedene Technologien, darunter:
Um ESRGAN zu verwenden, müssen Sie zunächst die Umgebung einrichten und die erforderlichen Pakete installieren. Anschließend können Sie ein Konfigurationsfile laden und das Modell trainieren.
ESRGAN hat bereits einige beeindruckende Ergebnisse erzielt, wie z.B. die Auflösung von Bildern mit niedriger Auflösung in Bilder mit höherer Auflösung.
ESRGAN wird unter der CC-BY-NC-ND-4.0-Lizenz veröffentlicht.
Real-ESRGAN ist eine Erweiterung von ESRGAN, die praktische Algorithmen für die Bild- und Videorestaurierung entwickelt. Es verwendet reine synthetische Daten zum Training und bietet eine Vielzahl von Funktionen, wie z.B. die Auflösung von Bildern und Videos, die Korrektur von Gesichtern und die Anpassung der Auflösung.
Das GitHub-Repository von ESRGAN und Real-ESRGAN finden Sie hier. Bugfixes und Beiträge sind willkommen!
* KI-Zusammenfassungen können Fehler enthalten. Alle Angaben ohne Gewähr.