PageRank Algoritması: Google'ın 1998 Doktora Tezinden Trilyon Dolarlık İmparatorluğa
İki Stanford doktora öğrencisi 1998'de "**web sayfalarını önem sırasına nasıl koyarız**?" sorusunu sordu. Cevapları — bir matrisin **özvektörü** — internet aramayı, dolayısıyla modern dijital ekonomiyi değiştirdi.

"Hangi sayfa önemli?"
1998 yılı, Stanford Üniversitesi. Larry Page ve Sergey Brin adında iki doktora öğrencisi, doktora tezi konusu arıyor:
"İnternet milyonlarca sayfa içeriyor. Bir kullanıcı arama yaptığında, en alakalı sayfaları nasıl gösteririz?"
Cevapları: PageRank. Bir matematik formülü, özvektör hesabıyla, trilyon dolarlık şirketi doğurdu.
Temel fikir
Bir sayfanın önemi = ona bağlı önemli sayfaların ağırlıklı toplamı.
Bu dairesel tanım — ama matematiksel olarak tutarlı çözüm var.
Matematiksel formülasyon
sayfa var. Bağlantı matrisi : eğer sayfası 'ye link veriyor.
PageRank vektörü :
= normalize edilmiş bağlantı matrisi. Her sayfa kendi PageRank'ini çıkan linklerine eşit dağıtır.
Yani , 'nin özdeğer 1'e karşılık gelen özvektörü.
Damping factor
Pratikte:
= damping factor (genelde 0.85). Bu, kullanıcının %85 link takip ederek, %15 rastgele sayfaya gitmesini modeller.
Bu, Markov zinciri sabit dağılımıdır.
İteratif çözüm
ile başla. Tekrar:
Yaklaşık 50-100 iterasyon'da yakınsar. Trilyonlarca sayfa için bile pratik.
Niçin işe yarıyor?
- Manipülasyon zor: spam siteleri kendine link verse de, önemli sitelerin desteği gerekir.
- Kalite metriği: doğal olarak iyi sayfaların yüksek skoru.
- Hesaplanabilir: büyük graf için bile.
Tarihsel köken
Önceden de akademik atıf analizi vardı: bir makalenin önemi = ona atıf yapılan diğer önemli makaleler. Bibliyometri (Garfield 1955+).
Page-Brin (1998): web sayfalarına uygulama.
Stanford makalesi: "The PageRank Citation Ranking: Bringing Order to the Web".
1998: Google şirketi kuruldu (Mountain View, California).
Niçin Google başarılı oldu?
1998 öncesi arama motorları (AltaVista, Yahoo, Lycos):
- Keyword matching: sadece kelime eşleşmesi.
- Spam: kelimeleri tekrarlayan sayfalar yüksek sıralanırdı.
Google PageRank ile:
- Otorite: önemli sayfalar yukarı.
- Spam direnci: link manipülasyonu zor.
Sonuç: dramatik olarak daha iyi sonuçlar. Kullanıcılar Google'a aktı.
Sonraki gelişmeler
PageRank tek başına yeterli değildi:
- 2000'ler: spam savaşı (link farms vs PageRank).
- 2003: Hilltop algoritması — uzman sayfalar.
- 2011: Panda — düşük kaliteli içerik penalty.
- 2013: Hummingbird — anlamsal arama.
- 2015: RankBrain — makine öğrenmesi.
- 2024: BERT, MUM — büyük dil modelleri ile arama.
Google'ın algoritması artık 200+ sinyal kullanıyor. PageRank hâlâ bir sinyal.
Genelleştirmeler
Personalized PageRank
Damping fonksiyonu kullanıcı-özel başlangıç noktası. Öneri sistemleri, sosyal ağ analizi.
Topic-sensitive PageRank
Konu-özel önem ölçüleri.
TwitterRank, etc.
Sosyal medya için adaptasyonlar.
Diğer uygulamalar
1. Akademik literatür
Eigenfactor, Article Influence Score — bilimsel dergiler için PageRank.
2. Sosyal ağ analizi
Twitter, Facebook, LinkedIn — kim "etkili"?
3. Tavsiye sistemleri
Netflix, Spotify, YouTube.
4. Sözlük tanımları
WordNet üzerinde semantik önem.
5. Biyoinformatik
Protein-protein etkileşim ağları.
6. Suç analizi
İletişim ağlarında "merkezi" figürler.
Felsefi anlamı
PageRank: "önem dolaşımdan gelir". Bir nesnenin değeri, kendi başına değil, diğerleriyle ilişkilerinden gelir.
Bu, modern ağ analizinin paradigmasıdır. Sosyal sermaye, akademik etki, kültürel sermaye — hepsi benzer şekilde işliyor.
Sonuç
PageRank algoritması:
- Özvektör hesabı — temel lineer cebir.
- Markov zinciri sabit dağılımı.
- Google'ın temel sırrı (1998-2003 dönemi).
- Modern ağ analizinin temel kavramı.
- Trilyon dolarlık şirket kuran 6 sayfalık makale.
Bir doktora tezi konusu, dünyanın en değerli şirketlerinden birinin fikri mülkiyeti. Matematik + iş zekası + zamanlama = Google.
Bir web araması yaptığınızda — saniyede milyarlarca defa — PageRank çalışıyor. Şu anda. Bu yazıyı bulurken.
"Önemli olan, önemli olanlarla bağlantılı olandır." Modern dijital çağın paradigma cümlesi.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. PageRank algoritmasının matematik temeli nedir?
2. PageRank kim ve ne zaman tanıttı?
3. Damping factor (0.85) ne modeller?
4. PageRank niçin Google'ın başarısının ana sebebi oldu?
5. Modern Google aramasında PageRank'in rolü nedir?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?