Tüm yazılar
Matematik12 Ekim 2025

En Küçük Kareler Yöntemi: Veriden Çizgi Çıkartmak

Bir grup veri noktasına "en uygun" çizgiyi nasıl çekersiniz? Gauss'un 18 yaşında geliştirdiği basit fikir bugün makine öğrenmesinden astronomiye uygulanmaya devam ediyor.

Matematik Karavanı Editörü 7 dk okuma 5 soru
Çubuk grafik ve oran tablosu

Veriler bir grafik, biz onun çizgisini arıyoruz

Hayal edin: bir botanikçi, bir bitkinin yağmur miktarına bağlı büyüme oranını ölçüyor. 10 farklı yağmur düzeyi için 10 büyüme ölçümü:

Yağmur (cm)Büyüme (cm)
25
38
511
613
......

Veri noktaları grafikte serpiştirilmiş. Bu noktalardan doğrusal bir bağ çıkarmak istiyorsunuz: "Yağmur arttıkça büyüme nasıl artar?"

Çıplak gözle bir çizgi çizebilirsiniz; ama farklı kişiler farklı çizgiler çekecek. Matematiksel olarak en iyi çizgi hangidir?

En küçük kareler yöntemi

En küçük kareler (least squares) yönteminin cevabı şudur:

"Tüm veri noktalarından çizgiye olan dikey uzaklıkların karelerinin toplamını en aza indiren çizgiyi seç."

Yani y=ax+by = ax + b doğrusunu arıyorsanız:

Hata=i=1n(yi(axi+b))2\text{Hata} = \sum_{i=1}^n (y_i - (ax_i + b))^2

ifadesini minimum yapan aa ve bb değerlerini bulun.

Formül

Cebirsel olarak çözüldüğünde (kalkülüs ile türev alıp sıfıra eşitleyince):

a=nxiyixiyinxi2(xi)2a = \frac{n \sum x_i y_i - \sum x_i \sum y_i}{n \sum x_i^2 - (\sum x_i)^2}

b=yiaxinb = \frac{\sum y_i - a \sum x_i}{n}

İki formül, hesap makinesi ile bile uygulanabilir. Modern istatistik yazılımları (Excel, Python, R) bunu otomatik yapar.

Niye "karelerin toplamı"?

Naif düşünce: "Hataların mutlak değerini topla, onu minimize et." Yani yi(axi+b)\sum |y_i - (ax_i + b)|. Bu da geçerli bir kriterdir; ama matematiksel olarak daha zor çözülür (mutlak değer türevlenebilir değil).

Kareleri kullanmanın avantajları:

  1. Türevlenebilir: kalkülüs ile kolayca minimize edilir.
  2. Büyük hatalara orantısız ceza: 10 birim sapan nokta, 5 birim sapan noktanın 4 katı kadar "kötü" sayılır. Bu, "aykırı değerleri" daha çok ciddiye alır.
  3. Olasılıksal yorumla: hatalar normal dağılıma sahipse, en küçük kareler maksimum olabilirlik tahmini verir.

Gauss'un 18 yaşındaki keşfi

Genç Carl Friedrich Gauss 1795'te yöntemi geliştirdi (yayımı 1809). Adrien-Marie Legendre 1805'te bağımsız olarak yayımladı. Öncelik tartışması Gauss ve Legendre arasında uzun süre sürdü.

Gauss'un kullanım amacı şaşırtıcıydı: astronomi. 1801'de italyan astronom Giuseppe Piazzi Ceres adlı küçük gezegeni keşfetti; ama yıldız Güneş'in arkasına geçince konumu kaybedildi. Birkaç hafta gözlem verisi vardı.

24 yaşındaki Gauss bu az veriden en küçük kareler yöntemiyle Ceres'in yörüngesini hesapladı; tahmini Aralık 1801'de doğrulandı. Bu Gauss'u Avrupa çapında üne kavuşturdu ve bilim camiasında ünlü matematikçi olarak yerini garantiledi.

Modern uygulamalar

En küçük kareler yöntemi modern bilimin en sık kullanılan istatistiksel araçtır:

Ekonomi ve finans

Lineer regresyon modellerinin temeli. Bir hisse senedinin getirisi, piyasa getirisi ile nasıl ilişkili? Faktör modellerinin omurgası.

Sosyal bilimler

Anket verileri, demografik veriler — pek çok bağıntı en küçük kareler ile keşfedilir. "Gelir düzeyi, eğitim seviyesi ile nasıl ilişkili?" gibi sorular.

Makine öğrenmesi

Lineer regresyon (doğrusal model), Ridge regresyon (L2 düzenleme), LASSO (L1 düzenleme) — hepsi en küçük kareler ailesinin üyesi. Modern derin öğrenmenin başlangıç modelleri.

Mühendislik

Sensör verilerinden parametre tahmini, sistem kalibrasyonu, sinyal filtreleme (Kalman filtresi).

Bilim deneyleri

Deneysel ölçümlerden teorik parametreleri çıkarmak; standart bilimsel raporlamanın temel aracı.

GPS

GPS uydularından gelen sinyallerin gecikmesinden kullanıcının konumunu hesaplamak — yine en küçük kareler.

"Doğrusal" değil her zaman

Klasik en küçük kareler doğrusal modeli varsayar (y=ax+by = ax + b). Ama:

  • Polinom regresyonu: y=a0+a1x+a2x2+y = a_0 + a_1 x + a_2 x^2 + \dots
  • Çoklu regresyon: y=a0+a1x1+a2x2++anxny = a_0 + a_1 x_1 + a_2 x_2 + \dots + a_n x_n
  • Doğrusal olmayan regresyon: y=aebxy = a e^{bx} gibi modeller — logaritma ile doğrusala dönüştürülür veya nümerik optimizasyon kullanılır.

Hepsinin altında "karelerin toplamını minimize et" mantığı vardır.

Sınırlamalar

En küçük kareler herşeyi çözmez:

  • Aykırı değerlere duyarlı: tek bir uçuk değer tüm çizgiyi bozabilir. Daha sağlam alternatifler: robust regression, L1 regresyon.
  • Doğrusal varsayım: gerçek dünya çoğu zaman doğrusal değildir.
  • Korelasyon ≠ nedensellik: en güzel doğrusal uyum bile nedensel ilişki garanti etmez.

Bir formülün şaşırtıcı evrenselliği

Karelerin toplamını minimize et — bu kısa cümle bugün:

  • Astronomide
  • Ekonomide
  • Mühendislikte
  • AI'da
  • Tıpta
  • Sosyolojide

— hep aynı şekilde çalışır. Bir 18 yaşında genç bir Alman matematikçinin asteroidi bulmak için kullandığı yöntem, modern bilimin en evrensel veri analizi tekniği olarak yaşıyor.

Bir bitkinin yağmurla ilişkisinden Mars'a giden bir robotun yörüngesine kadar — temelinde aynı sade fikir: mesafenin karesini en aza indir.

Etiketler

en küçük karelerlineer regresyongaussistatistikoptimizasyon

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. En küçük kareler yöntemi neyi minimize eder?

2. Niçin "kare" kullanılır, mutlak değer değil?

3. Gauss en küçük kareler yöntemini ilk olarak hangi pratik problem için kullandı?

4. En küçük kareler yöntemini Gauss'tan bağımsız olarak ilk yayımlayan kişi kimdir?

5. En küçük kareler yönteminin temel sınırlaması nedir?