Modelo de super-resolução por rede neural. Mais rápido, ideal para fotos, ilustrações, anime e capturas de ecrã. 15–30 segundos.
- Scale: 2×, 4×, 8×
- Processing time: ~15–30 seconds
- Face enhance: optional GFPGAN
- Best for: photos, screenshots, anime, illustrations
- Output: very clean, no artifacts
- Open source (BSD-3-Clause)
Ampliador baseado em Stable Diffusion que adiciona detalhes e texturas reais. Ideal para retratos, fotografia de natureza. 45–90 segundos.
- Scale: 2×, 4×
- Processing time: ~45–90 seconds
- Creativity + resemblance controls
- Best for: portraits, nature, artistic photography
- Output: richly detailed, AI-enhanced
- Open source (Apache-2.0)
Comparação completa de especificações
| Especificação | Real-ESRGAN | Clarity Upscaler |
|---|---|---|
| Arquitetura | RRDB + GAN | Stable Diffusion XL (tile) |
| Fatores de escala | 2×, 4×, 8× | 2×, 4× |
| Velocidade de processamento | ~15–30 s | ~45–90 s |
| Estilo de saída | Limpo, natural | Muito detalhado, melhorado por IA |
| Melhoria facial | Sim (GFPGAN) | Não (incorporado) |
| Parâmetros ajustáveis | Scale, face_enhance | Scale, creativity, resemblance, prompt |
| Melhores tipos de imagem | Photos, screenshots, anime | Portraits, nature, art |
| Risco de alucinação | Muito baixo | Moderado (com alta criatividade) |
| Código aberto | Yes (BSD-3) | Yes (Apache-2) |
| Alojamento | Replicate API | Replicate API |
O que é o Real-ESRGAN?
Real-ESRGAN é uma versão melhorada do modelo ESRGAN original, treinado especificamente em imagens degradadas do mundo real — artefactos de compressão, desfocagem, ruído, baixa resolução.
A arquitetura usa blocos densos residuais (RRDB) como gerador, treinado contra um discriminador que aprende o que é "alta resolução real".
Quando escolher Real-ESRGAN: A velocidade é importante, a escala 8× é necessária, ou está a amplificar capturas de ecrã, ilustrações, logos, anime.
O que é o Clarity Upscaler?
Clarity Upscaler é um amplificador baseado em mosaicos construído em Stable Diffusion XL. Usa um processo de difusão para gerar ativamente novo conteúdo de pixels.
O parâmetro criatividade controla a agressividade com que a IA adiciona novos detalhes. O parâmetro semelhança controla a fidelidade à composição original.
Quando escolher Clarity Upscaler: A qualidade de saída máxima é o objetivo, especialmente para retratos, fotografia de paisagem, fotos de produtos em estúdio.