⚡ 最速
Real-ESRGAN
nightmareai/real-esrgan on Replicate
ニューラルネットワーク超解像モデル。最速のアップスケーラー、写真、イラスト、アニメ、スクリーンショットに最適。15〜30秒。
- Scale: 2×, 4×, 8×
- Processing time: ~15–30 seconds
- Face enhance: optional GFPGAN
- Best for: photos, screenshots, anime, illustrations
- Output: very clean, no artifacts
- Open source (BSD-3-Clause)
✨ 最高品質
Clarity Upscaler
philz1337x/clarity-upscaler on Replicate
Stable Diffusionベースのアップスケーラー。詳細とテクスチャを実際に追加します。ポートレート、自然写真に最適。45〜90秒。
- Scale: 2×, 4×
- Processing time: ~45–90 seconds
- Creativity + resemblance controls
- Best for: portraits, nature, artistic photography
- Output: richly detailed, AI-enhanced
- Open source (Apache-2.0)
並べて比較
完全な仕様比較
| 仕様 | Real-ESRGAN | Clarity Upscaler |
|---|---|---|
| アーキテクチャ | RRDB + GAN | Stable Diffusion XL (tile) |
| スケールファクター | 2×, 4×, 8× | 2×, 4× |
| 処理速度 | ~15–30 s | ~45–90 s |
| 出力スタイル | クリーン、自然 | 非常に詳細、AI強化 |
| 顔強化 | はい(GFPGAN) | いいえ(内蔵) |
| 調整可能なパラメータ | Scale, face_enhance | Scale, creativity, resemblance, prompt |
| 最適な画像の種類 | Photos, screenshots, anime | Portraits, nature, art |
| ハルシネーションリスク | 非常に低い | 中程度(高クリエイティビティ時) |
| オープンソース | Yes (BSD-3) | Yes (Apache-2) |
| ホスティング | Replicate API | Replicate API |
Real-ESRGANとは?
Real-ESRGANは元のESRGANモデルの改良版で、圧縮アーティファクト、ぼかし、ノイズ、低解像度など現実世界の劣化した画像に特化してトレーニングされています。
アーキテクチャは、「本物の高解像度」の見た目を学習するディスクリミネーターに対してトレーニングされたジェネレーターとして残差-イン-残差密ブロック(RRDB)を使用します。
Real-ESRGANを選ぶとき: 速度が重要、8×スケールが必要、またはスクリーンショット、イラスト、ロゴ、アニメをアップスケールする場合。
Clarity Upscalerとは?
Clarity UpscalerはStable Diffusion XL上に構築されたタイルベースのアップスケーラーです。拡散プロセスを使用して新しいピクセルコンテンツをアクティブに生成します。
クリエイティビティパラメータは、AIが新しい詳細をどの程度積極的に追加するかを制御します。類似度パラメータは、出力が元の構成にどの程度忠実かを制御します。
Clarity Upscalerを選ぶとき: 最大出力品質が目標の場合、特にポートレート、風景写真、スタジオ製品写真。