ImageNet: Modern Bilgisayar Görüsünü Başlatan Veri Seti
2007'de Stanford'da bir doçent başladı: **14 milyon görüntü, 20000 kategori**. Manuel etiketleme için **49000 işçi, 167 ülke**. 2012 ImageNet yarışmasında AlexNet derin öğrenmeyi dünyaya tanıttı. Modern AI patlamasının veri tabanı.

"Veri bilim insanların petrolüdür"
2007 yılı, Princeton (sonra Stanford). Fei-Fei Li adlı bir doçent büyük bir projeye başladı:
"Çok detaylı bir görüntü veri seti yap. Modern AI buna ihtiyaç duyacak."
3 yıl, 14 milyon görüntü, 20000 kategori, 49000 işçi (Amazon Mechanical Turk), 167 ülke'den manuel etiketleme.
ImageNet doğdu.
Veri seti özellikleri
- 14 milyon etiketli görüntü.
- WordNet taksonomisine göre 20000+ kategori.
- "Köpek" 120 alt-tür, "meyve" 50.
Modern öncesinin en kapsamlı görüntü veri seti.
ILSVRC (2010-)
ImageNet Large Scale Visual Recognition Challenge yarışması.
Her yıl: 1000 kategori, 1.2 milyon eğitim görüntüsü.
Bilgisayar görüsü topluluğunun standart benchmark'ı.
2010-2011
Klasik bilgisayar görüsü:
- SVM + el yapımı özellikler.
- ~%25 hata.
2012 — AlexNet patlaması
Krizhevsky, Sutskever, Hinton: AlexNet — derin konvolüsyonel sinir ağı.
- %15.3 hata oranı.
-
- yer (klasik yöntem): %26 hata.
10+ puan fark. Modern derin öğrenmenin kamuoyu uyanışı.
Sonraki yıllar
- 2013 ZFNet: %11.7.
- 2014 GoogLeNet, VGG: %6.7.
- 2015 ResNet: %3.6 (insan seviyesinde!).
- 2017: %2.25.
Modern derin öğrenme yarışmayı çözdü.
ImageNet'in etkileri
1. Derin öğrenme patlaması
2012 sonrası AI yatırımları ve araştırma dramatik arttı.
2. Transfer learning
ImageNet'te eğitilmiş modeller başka görevler için kullanılır.
3. Pretrained modeller
ResNet, VGG, EfficientNet — modern bilgisayar görüsü standardı.
4. Multimodal AI
CLIP gibi modeller ImageNet temellerini kullanır.
5. Veri merkezli AI
"Veri kalitesi modelden önemli" felsefesinin başlangıcı.
Fei-Fei Li
ImageNet'in mucidi:
- Çinli-Amerikalı AI bilim insanı.
- Stanford profesörü.
- Google Cloud AI Chief Scientist (2017-18).
- Modern AI etiği savunucusu.
- "AI yenilik için" felsefesi.
ImageNet eleştirileri
- Veri önyargısı: Batılı, Hindistan az.
- Kategori sorunları: bazı kategoriler ayrımcı.
- Etiket kalitesi: %5-10 hata.
- Veri çekme etiği: izin alınmadan kullanım.
Modern AI etiği tartışmalarının önemli alanı.
Modern alanlar
LAION-5B
5 milyar görüntü-metin çifti. Stable Diffusion eğitiminde kullanıldı.
ImageNet-21K
Daha büyük 21000 kategorili versiyon.
MS-COCO
Modern bilgisayar görüsü standardı.
Sonuç
ImageNet:
- Modern AI patlamasının veri tabanı.
- Fei-Fei Li (2007-) vizyonu.
- AlexNet (2012) ile derin öğrenme çağının başlangıcı.
- ILSVRC klasik AI benchmark'ı.
- Veri merkezli AI felsefesinin kökü.
Modern AI tarihinin görünmez ama vazgeçilmez veri seti. 14 milyon görüntüden modern AI patlaması doğdu.
"Modern AI veri sayesinde mümkündür." Fei-Fei Li'nin paradigması.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. ImageNet kim tarafından ne zaman başlatıldı?
2. AlexNet (2012) niye dönüm noktası?
3. ImageNet 2015'te insan seviyesine ne zaman ulaştı?
4. ImageNet hangi modern alanları etkiledi?
5. ImageNet'in eleştirileri nelerdir?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?