ControlNet: Stable Diffusion'a "Yön Vermek" için Zarif Bir Mimari
Bir kalem çizimi → tam renkli görüntü. Bir poz iskeleti → giyimli figür. ControlNet 2023'te diffusion'ı kontrol edilebilir hale getirdi.

"Stable Diffusion'u yönetmek"
Klasik Stable Diffusion:
- "Bir kedi" → kedi.
- Ama hangi pozda, hangi açıdan? Bilinmez.
İhtiyaç: kontrol.
- Belirli poz.
- Belirli çizgi (sketch'ten boya).
- Belirli derinlik.
- Belirli şablon.
ControlNet (Şubat 2023)
Lvmin Zhang (Stanford doktora):
- Stable Diffusion'a ek bir alt ağ (control branch).
- Pre-trained SD ağırlıkları dondur.
- Sadece control branch eğit.
Sonuç: kontrol edilebilir SD.
Nasıl çalışır?
- SD ağırlıkları sabit.
- Kopyala SD encoder'ı.
- Kopyaya zero convolution ekle → başlangıçta etkisiz.
- Control görüntüsünü kopyaya ver.
- Eğit: control görüntü → SD'nin çıkışını etkile.
Zero convolution trick: yavaş yavaş etki kazansın.
Control türleri
Pose
OpenPose iskelet → figür.
Edge
Canny edge → renkli görüntü.
Depth
Depth map → 3D-aware görüntü.
Normal
Normal map.
Segmentation
Semantic seg → renk.
Scribble
Karalama → tam görüntü.
Lineart
Çizim → boyama.
HED
Hierarchical edges.
MLSD
Çizgi geometrik.
Soft edge
PiDi soft.
Reference
Bir referans görüntü stiline uy.
Pratik kullanım
from diffusers import StableDiffusionControlNetPipeline, ControlNetModel
import torch
controlnet = ControlNetModel.from_pretrained(
"lllyasviel/sd-controlnet-canny"
)
pipe = StableDiffusionControlNetPipeline.from_pretrained(
"runwayml/stable-diffusion-v1-5",
controlnet=controlnet,
).to("cuda")
# Canny edge ile kontrollü üretim
image = pipe(
"modern bir bina, renkli",
image=canny_edge_image,
).images[0]
Multi-ControlNet
Birden fazla kontrol aynı anda:
- Pose + Canny.
- Depth + Segmentation.
Her birinin ağırlığı ayarlanabilir.
Avantajlar
Profesyonel kontrol
- Tasarımcı poz vermesi.
- Mimari çizim renklendirmesi.
- Karikatür stili koruması.
Hızlı iterasyon
- Sketch çiz → SD ile renklendir.
- Hızlı prototip.
Tutarlılık
- Karakter pozu sabit.
- Video frame'ler arası tutarlılık.
Sınırlamalar
Kalite
ControlNet biraz detay kaybedebilir.
Eğitim
Her control türü için ayrı model.
Birleştirme
Çoklu control beceriksiz olabilir.
Modern alternatifler
T2I-Adapter
ControlNet'in küçük versiyonu. Daha az parametre.
IP-Adapter
Image prompt: bir görüntüyü "stil" olarak kullan.
Reference-only
Sadece referans image attention paylaşımı.
InstantID
Bir yüz fotoğrafı → tutarlı karakterler.
SDXL ControlNet
SD XL için ayrı ControlNet'ler:
- Daha güçlü SD.
- Aynı kontrol mantığı.
SD 3 ile
SD 3 mimari farklı (DiT) — ControlNet doğrudan uygulanmaz. Yeni teknikler:
- MM-DiT integration.
- FLUX ControlNet (Black Forest Labs).
Modern AI yaratıcı iş akışı
Profesyonel sanatçı:
- Karakter pozu çiz.
- Pose ControlNet ile karakter üret.
- Karakter karakterini koru.
- Sahne arkaplan ayrıca üret.
- Birleştir.
İnsan + AI birlikte sanat üretiyor.
Türk uygulamaları
- Türk yaratıcılar: ControlNet ile Türkçe gelişen AI sanat.
- Reklam ajansları: poz kontrolü.
- Türk dijital sanatçılar: Refik Anadol benzeri kontrollü.
Lvmin Zhang
Stanford doktora öğrencisi:
- Çinli-Amerikalı.
- ControlNet doktora çalışması.
- 2023 sonrası dünya çapı tanınma.
- AI sanat topluluğunun kahramanı.
Felsefe
ControlNet temel mesajı: "AI yaratıcılık insanı yerine değil yanında olmalı".
Tasarımcı kontrolü AI üretkenlikle birleşir.
Genç AI mühendisi için ders
ControlNet:
- Pre-trained model + ek branch zarif.
- Zero convolution clever trick.
- Pratik etki maksimum.
- Doktora çalışması dünya değiştirebilir.
Kapanış
ControlNet, Stable Diffusion çağının kontrol devrimi. AI'i tasarımcının emrine verdi.
Bir AI sanat mühendisinin olgunluk işareti: hangi ControlNet, hangi durumda kullanmak.
Yaratıcılık + AI = ControlNet.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. ControlNet ne yapar?
2. Mucidi?
3. Zero convolution?
4. Çoklu control?
5. Modern alternatif?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?