Tüm yazılar
Matematik9 Ağustos 2025

PageRank Algoritması: Google'ın 1998 Doktora Tezinden Trilyon Dolarlık İmparatorluğa

İki Stanford doktora öğrencisi 1998'de "**web sayfalarını önem sırasına nasıl koyarız**?" sorusunu sordu. Cevapları — bir matrisin **özvektörü** — internet aramayı, dolayısıyla modern dijital ekonomiyi değiştirdi.

Matematik Karavanı Editörü 5 dk okuma 5 soru
Google logosu — PageRank'in en ünlü uygulaması

"Hangi sayfa önemli?"

1998 yılı, Stanford Üniversitesi. Larry Page ve Sergey Brin adında iki doktora öğrencisi, doktora tezi konusu arıyor:

"İnternet milyonlarca sayfa içeriyor. Bir kullanıcı arama yaptığında, en alakalı sayfaları nasıl gösteririz?"

Cevapları: PageRank. Bir matematik formülü, özvektör hesabıyla, trilyon dolarlık şirketi doğurdu.

Temel fikir

Bir sayfanın önemi = ona bağlı önemli sayfaların ağırlıklı toplamı.

Bu dairesel tanım — ama matematiksel olarak tutarlı çözüm var.

Matematiksel formülasyon

NN sayfa var. Bağlantı matrisi LL: Lij=1L_{ij} = 1 eğer jj sayfası ii'ye link veriyor.

PageRank vektörü r\mathbf{r}:

r=Mr\mathbf{r} = M \mathbf{r}

MM = normalize edilmiş bağlantı matrisi. Her sayfa kendi PageRank'ini çıkan linklerine eşit dağıtır.

Yani r\mathbf{r}, MM'nin özdeğer 1'e karşılık gelen özvektörü.

Damping factor

Pratikte:

r=dMr+(1d)1/N\mathbf{r} = d M \mathbf{r} + (1-d) \mathbf{1}/N

dd = damping factor (genelde 0.85). Bu, kullanıcının %85 link takip ederek, %15 rastgele sayfaya gitmesini modeller.

Bu, Markov zinciri sabit dağılımıdır.

İteratif çözüm

r0=1/N\mathbf{r}_0 = \mathbf{1}/N ile başla. Tekrar:

rk+1=dMrk+(1d)/N\mathbf{r}_{k+1} = d M \mathbf{r}_k + (1-d)/N

Yaklaşık 50-100 iterasyon'da yakınsar. Trilyonlarca sayfa için bile pratik.

Niçin işe yarıyor?

  • Manipülasyon zor: spam siteleri kendine link verse de, önemli sitelerin desteği gerekir.
  • Kalite metriği: doğal olarak iyi sayfaların yüksek skoru.
  • Hesaplanabilir: büyük graf için bile.

Tarihsel köken

Önceden de akademik atıf analizi vardı: bir makalenin önemi = ona atıf yapılan diğer önemli makaleler. Bibliyometri (Garfield 1955+).

Page-Brin (1998): web sayfalarına uygulama.

Stanford makalesi: "The PageRank Citation Ranking: Bringing Order to the Web".

1998: Google şirketi kuruldu (Mountain View, California).

Niçin Google başarılı oldu?

1998 öncesi arama motorları (AltaVista, Yahoo, Lycos):

  • Keyword matching: sadece kelime eşleşmesi.
  • Spam: kelimeleri tekrarlayan sayfalar yüksek sıralanırdı.

Google PageRank ile:

  • Otorite: önemli sayfalar yukarı.
  • Spam direnci: link manipülasyonu zor.

Sonuç: dramatik olarak daha iyi sonuçlar. Kullanıcılar Google'a aktı.

Sonraki gelişmeler

PageRank tek başına yeterli değildi:

  • 2000'ler: spam savaşı (link farms vs PageRank).
  • 2003: Hilltop algoritması — uzman sayfalar.
  • 2011: Panda — düşük kaliteli içerik penalty.
  • 2013: Hummingbird — anlamsal arama.
  • 2015: RankBrain — makine öğrenmesi.
  • 2024: BERT, MUM — büyük dil modelleri ile arama.

Google'ın algoritması artık 200+ sinyal kullanıyor. PageRank hâlâ bir sinyal.

Genelleştirmeler

Personalized PageRank

Damping fonksiyonu kullanıcı-özel başlangıç noktası. Öneri sistemleri, sosyal ağ analizi.

Topic-sensitive PageRank

Konu-özel önem ölçüleri.

TwitterRank, etc.

Sosyal medya için adaptasyonlar.

Diğer uygulamalar

1. Akademik literatür

Eigenfactor, Article Influence Score — bilimsel dergiler için PageRank.

2. Sosyal ağ analizi

Twitter, Facebook, LinkedIn — kim "etkili"?

3. Tavsiye sistemleri

Netflix, Spotify, YouTube.

4. Sözlük tanımları

WordNet üzerinde semantik önem.

5. Biyoinformatik

Protein-protein etkileşim ağları.

6. Suç analizi

İletişim ağlarında "merkezi" figürler.

Felsefi anlamı

PageRank: "önem dolaşımdan gelir". Bir nesnenin değeri, kendi başına değil, diğerleriyle ilişkilerinden gelir.

Bu, modern ağ analizinin paradigmasıdır. Sosyal sermaye, akademik etki, kültürel sermaye — hepsi benzer şekilde işliyor.

Sonuç

PageRank algoritması:

  • Özvektör hesabı — temel lineer cebir.
  • Markov zinciri sabit dağılımı.
  • Google'ın temel sırrı (1998-2003 dönemi).
  • Modern ağ analizinin temel kavramı.
  • Trilyon dolarlık şirket kuran 6 sayfalık makale.

Bir doktora tezi konusu, dünyanın en değerli şirketlerinden birinin fikri mülkiyeti. Matematik + iş zekası + zamanlama = Google.

Bir web araması yaptığınızda — saniyede milyarlarca defa — PageRank çalışıyor. Şu anda. Bu yazıyı bulurken.

"Önemli olan, önemli olanlarla bağlantılı olandır." Modern dijital çağın paradigma cümlesi.

Etiketler

PageRankGooglegraf teorisiözvektörweb araması

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. PageRank algoritmasının matematik temeli nedir?

2. PageRank kim ve ne zaman tanıttı?

3. Damping factor (0.85) ne modeller?

4. PageRank niçin Google'ın başarısının ana sebebi oldu?

5. Modern Google aramasında PageRank'in rolü nedir?