Modèle de super-résolution par réseau de neurones. Le plus rapide, idéal pour photos, illustrations, anime et captures d'écran. 15–30 secondes.
- Scale: 2×, 4×, 8×
- Processing time: ~15–30 seconds
- Face enhance: optional GFPGAN
- Best for: photos, screenshots, anime, illustrations
- Output: very clean, no artifacts
- Open source (BSD-3-Clause)
Outil basé sur Stable Diffusion qui ajoute réellement des détails et textures. Idéal pour portraits, photographie de nature. 45–90 secondes.
- Scale: 2×, 4×
- Processing time: ~45–90 seconds
- Creativity + resemblance controls
- Best for: portraits, nature, artistic photography
- Output: richly detailed, AI-enhanced
- Open source (Apache-2.0)
Comparaison complète des spécifications
| Spécification | Real-ESRGAN | Clarity Upscaler |
|---|---|---|
| Architecture | RRDB + GAN | Stable Diffusion XL (tile) |
| Facteurs d'échelle | 2×, 4×, 8× | 2×, 4× |
| Vitesse de traitement | ~15–30 s | ~45–90 s |
| Style de sortie | Propre, naturel | Très détaillé, amélioré par IA |
| Amélioration du visage | Oui (GFPGAN) | Non (intégré) |
| Paramètres ajustables | Scale, face_enhance | Scale, creativity, resemblance, prompt |
| Meilleurs types d'images | Photos, screenshots, anime | Portraits, nature, art |
| Risque d'hallucination | Très faible | Modéré (à créativité élevée) |
| Open source | Yes (BSD-3) | Yes (Apache-2) |
| Hébergement | Replicate API | Replicate API |
Qu'est-ce que Real-ESRGAN ?
Real-ESRGAN est une version améliorée du modèle ESRGAN original, entraîné spécifiquement sur des images dégradées du monde réel — artefacts de compression, flou, bruit, basse résolution.
L'architecture utilise des blocs denses résiduels (RRDB) comme générateur, entraîné contre un discriminateur qui apprend ce qu'est une "vraie haute résolution".
Quand choisir Real-ESRGAN : La vitesse est importante, l'échelle 8× est nécessaire, ou vous agrandissez des captures d'écran, illustrations, logos, anime.
Qu'est-ce que Clarity Upscaler ?
Clarity Upscaler est un outil basé sur les tuiles construit sur Stable Diffusion XL avec le checkpoint Juggernaut Reborn. Il utilise un processus de diffusion pour générer activement du nouveau contenu de pixels.
Le paramètre créativité contrôle l'agressivité avec laquelle l'IA ajoute de nouveaux détails. Le paramètre ressemblance contrôle la fidélité du résultat à la composition originale.
Quand choisir Clarity Upscaler : La qualité de sortie maximale est l'objectif, notamment pour les portraits, la photographie de paysage, les photos de produits en studio.