ImageNet kim tarafından ne zaman başlatıldı?

Fei-Fei Li (Stanford, 2007-) — 14 milyon görüntü, 20K kategori

AlexNet (2012) niye dönüm noktası?

ImageNet 2012 yarışmasını %15.3 hata ile kazandı; 2. yer %26 — 10+ puan fark

ImageNet 2015'te insan seviyesine ne zaman ulaştı?

%3.6 hata ile ResNet (2015) — insan seviyesinin altında

ImageNet hangi modern alanları etkiledi?

Derin öğrenme + transfer learning + multimodal AI + veri merkezli AI

ImageNet'in eleştirileri nelerdir?

Veri önyargısı, ayrımcı kategoriler, etiket kalitesi, izinsiz veri çekme

ImageNet: Modern Bilgisayar Görüsünü Başlatan Veri Seti

"Veri bilim insanların petrolüdür"

2007 yılı, Princeton (sonra Stanford). Fei-Fei Li adlı bir doçent büyük bir projeye başladı:

"Çok detaylı bir görüntü veri seti yap. Modern AI buna ihtiyaç duyacak."

3 yıl, 14 milyon görüntü, 20000 kategori, 49000 işçi (Amazon Mechanical Turk), 167 ülke'den manuel etiketleme.

ImageNet doğdu.

Veri seti özellikleri

14 milyon etiketli görüntü.
WordNet taksonomisine göre 20000+ kategori.
"Köpek" 120 alt-tür, "meyve" 50.

Modern öncesinin en kapsamlı görüntü veri seti.

ILSVRC (2010-)

ImageNet Large Scale Visual Recognition Challenge yarışması.

Her yıl: 1000 kategori, 1.2 milyon eğitim görüntüsü.

Bilgisayar görüsü topluluğunun standart benchmark'ı.

2010-2011

Klasik bilgisayar görüsü:

SVM + el yapımı özellikler.
~%25 hata.

2012 — AlexNet patlaması

Krizhevsky, Sutskever, Hinton: AlexNet — derin konvolüsyonel sinir ağı.

%15.3 hata oranı.
1. yer (klasik yöntem): %26 hata.

10+ puan fark. Modern derin öğrenmenin kamuoyu uyanışı.

Sonraki yıllar

2013 ZFNet: %11.7.
2014 GoogLeNet, VGG: %6.7.
2015 ResNet: %3.6 (insan seviyesinde!).
2017: %2.25.

Modern derin öğrenme yarışmayı çözdü.

ImageNet'in etkileri

1. Derin öğrenme patlaması

2012 sonrası AI yatırımları ve araştırma dramatik arttı.

2. Transfer learning

ImageNet'te eğitilmiş modeller başka görevler için kullanılır.

3. Pretrained modeller

ResNet, VGG, EfficientNet — modern bilgisayar görüsü standardı.

4. Multimodal AI

CLIP gibi modeller ImageNet temellerini kullanır.

5. Veri merkezli AI

"Veri kalitesi modelden önemli" felsefesinin başlangıcı.

Fei-Fei Li

ImageNet'in mucidi:

Çinli-Amerikalı AI bilim insanı.
Stanford profesörü.
Google Cloud AI Chief Scientist (2017-18).
Modern AI etiği savunucusu.
"AI yenilik için" felsefesi.

ImageNet eleştirileri

Veri önyargısı: Batılı, Hindistan az.
Kategori sorunları: bazı kategoriler ayrımcı.
Etiket kalitesi: %5-10 hata.
Veri çekme etiği: izin alınmadan kullanım.

Modern AI etiği tartışmalarının önemli alanı.

Modern alanlar

LAION-5B

5 milyar görüntü-metin çifti. Stable Diffusion eğitiminde kullanıldı.

ImageNet-21K

Daha büyük 21000 kategorili versiyon.

MS-COCO

Modern bilgisayar görüsü standardı.

Sonuç

ImageNet:

Modern AI patlamasının veri tabanı.
Fei-Fei Li (2007-) vizyonu.
AlexNet (2012) ile derin öğrenme çağının başlangıcı.
ILSVRC klasik AI benchmark'ı.
Veri merkezli AI felsefesinin kökü.

Modern AI tarihinin görünmez ama vazgeçilmez veri seti. 14 milyon görüntüden modern AI patlaması doğdu.

"Modern AI veri sayesinde mümkündür." Fei-Fei Li'nin paradigması.