Tüm yazılar
Matematik29 Temmuz 2025

Gizli Markov Modelleri (HMM): Konuşma Tanımadan Genetiğe Dijital Çağın Gizli İşletmecisi

Bir mikrofonun aldığı ses sinyali — ama altında konuşulan **kelimeler ne**? Bir DNA dizisi — ama hangi bölgesi **gen**, hangisi **gürültü**? HMM, bu "**altta yatan gizli durum**" çıkarımının matematiği. Modern AI öncesi standartdı.

Matematik Karavanı Editörü 6 dk okuma 5 soru
Mikrofon ve ses dalgaları — HMM'in klasik uygulaması

"Altta yatan gerçek ne?"

Bir mikrofon ses sinyali aldı. Ama bu sinyalin altında konuşulan kelimeler ne? Bunu bilmek istiyoruz.

Veya: DNA dizisinde gen bölgeleri ile junk DNA birbirine girmiş. Hangi nükleotidin nereye ait olduğunu görmüyoruz.

Veya: bir hisse senedinin fiyat dalgalanmaları gözlenebilir, ama piyasanın "hidden" durumu ("bull" vs "bear" pazarı) görünmez.

Bu üç soru aynı matematik yapıya sahip: gözlemlenebilir veriden gizli durum çıkarımı. Çözümü: Gizli Markov Modeli (Hidden Markov Model, HMM).

HMM nedir?

İki seviyeli bir model:

  1. Gizli durumlar S1,S2,,STS_1, S_2, \ldots, S_T: bir Markov zinciri (görünmüyor).
  2. Gözlemler O1,O2,,OTO_1, O_2, \ldots, O_T: her gizli durum bir gözlem üretir (görünüyor).

Parametreler:

  • Başlangıç olasılığı πi=P(S1=i)\pi_i = P(S_1 = i).
  • Geçiş olasılığı aij=P(St+1=jSt=i)a_{ij} = P(S_{t+1} = j \mid S_t = i).
  • Emisyon olasılığı bi(o)=P(Ot=oSt=i)b_{i}(o) = P(O_t = o \mid S_t = i).

Klasik örnek — sıcaklık ve dondurma

Bir gözlemci sadece kaç dondurma yendiğini görüyor: Ot{0,1,2,3}O_t \in \{0, 1, 2, 3\}. Hava durumu gizli: St{sıcak,sog˘uk}S_t \in \{\text{sıcak}, \text{soğuk}\}.

Geçiş olasılıkları: P(sıcaksıcak)=0.7P(\text{sıcak} \to \text{sıcak}) = 0.7, P(sıcaksog˘uk)=0.3P(\text{sıcak} \to \text{soğuk}) = 0.3, vs.

Emisyon: sıcak günde 3 dondurma yeme olasılığı 0.5; soğuk günde 0.

Şimdi gözlem dizisi O=(3,2,0,1,3)O = (3, 2, 0, 1, 3) verildiğinde, sıcaklık durumu dizisi (S1,...,S5)(S_1, ..., S_5) ne olmuştur?

Bu HMM çıkarım problemlerine ait.

Üç temel problem

1. Olasılık hesabı (Forward)

P(Oλ)P(O \mid \lambda) — gözlem dizisinin model verildiğindeki olasılığı.

Forward algoritması ile O(TN2)O(T \cdot N^2) zamanda (NN = gizli durum sayısı).

2. En olası gizli dizi (Decoding)

argmaxSP(SO,λ)\arg\max_S P(S \mid O, \lambda) — en muhtemel gizli dizi.

Viterbi algoritması (1967): dinamik programlama. O(TN2)O(T \cdot N^2).

3. Parametre öğrenimi (Learning)

Verilen OO kullanarak λ=(π,A,B)\lambda = (\pi, A, B) tahmin et.

Baum-Welch algoritması (1966) — EM'in HMM özel hali. İteratif.

Viterbi algoritması — detay

Dinamik programlama:

δt(j)=maxiδt1(i)aijbj(Ot)\delta_t(j) = \max_{i} \delta_{t-1}(i) \cdot a_{ij} \cdot b_j(O_t)

δt(j)\delta_t(j) = en muhtemel yolun tt-inci adımda jj durumunda olma olasılığı.

Geri izleme: en yüksek δT\delta_T'den başlayıp geri yön ile en iyi gizli dizi.

Andrew Viterbi (1967): asıl ihtiyaç dijital iletişim (kod çözme). Modern her cep telefonu, modem, DVD'lerin Reed-Solomon kod çözücüsü Viterbi kullanır.

Uygulamalar

1. Konuşma tanıma

1960-2000 arası konuşma tanımanın altın çağı HMM'di. Her fonem bir gizli durum, ses dalgası gözlem.

Modern derin öğrenme (Wav2Vec, Whisper) HMM'i 2020'lerde büyük ölçüde yendi, ama HMM hâlâ pratik baseline.

2. Biyoinformatik

Gen tanıma: DNA dizisinde gen bölgelerini bulma. HMMler (PROFILER, GENSCAN) genetik araştırmanın temel araçları.

Protein dizisi hizalama: HHsearch, HHblits.

3. Doğal dil işleme

Part-of-speech tagging: her kelimenin sözcük türü. Modern transformer öncesi HMM standardı.

Naive Bayes / HMM klasik metin sınıflandırma.

4. Finans

Volatilite rejim algılama: piyasa "bull" mu "bear" mı? HMM klasik.

5. Robotik ve takip

Robot lokalizasyonu: belirsiz sensörlerden konum çıkarımı. Kalman filtresi = sürekli HMM özel hali.

6. Müzik analizi

Notalar dizisinin temel yapısı (akor değişimleri, tonalite).

Tarihsel köken

  • Andrei Markov (1913): Markov zincirleri.
  • Leonard Baum, Lloyd Welch (1966): Baum-Welch algoritması ve HMM kavramı, IDA (Institute for Defense Analyses).
  • Andrew Viterbi (1967): Viterbi algoritması.
  • L.R. Rabiner (1989): ünlü tutorial — HMM'i konuşma tanıma çevresine yaydı.

Modern alternatifler

HMM'in eksiklikleri modern derin öğrenme ile aşıldı:

  • RNN, LSTM, GRU (2010'lar): uzun bağımlılıkları daha iyi yakalar.
  • Transformer (2017'den beri): dikkat mekanizmasıyla HMM'in ötesine geçer.
  • CNN (görüntü gözleminde).

Yine de HMM:

  • Yorumlanabilir (gizli durumlar anlamlı).
  • Az veri ile çalışır.
  • Az hesap gerektirir.
  • Baseline olarak hâlâ değerli.

Sürekli HMM — Kalman filtresi

Eğer gizli durumlar sürekli ve Gauss dağılımlı ise:

  • Geçiş: lineer + Gauss gürültü.
  • Emisyon: lineer + Gauss gürültü.

Bu, Kalman filtresi (1960). Roket güdümünden GPS'e standart araç.

Sonuç

Gizli Markov Modelleri:

  • Modern dijital çağın görünmez işletmecisi.
  • "Gözlemlenebilir veri + gizli yapı + Markov varsayımı" formülü.
  • Viterbi, Forward-Backward, Baum-Welch algoritmalarıyla pratik.
  • Konuşma tanıma, biyoinformatik, finans, robotik uygulamaları.
  • Modern derin öğrenmenin öncüsü ve baseline'i.

Bir kişi telefon aramaları yaparken, Whatsapp sesli mesaj atarken, Spotify önerilerini alırken, Maps'te konumu görürken — HMM ya doğrudan ya da onun devamı olan modellerden geliyor.

1966'da Leonard Baum ve ekibinin gizli askeri tesislerde geliştirdiği bu model, 60 yıl sonra dijital çağın temel taşı oldu.

"Görünenin altında ne var?" Soru insan zekasının en eski sorularından biri. HMM matematik cevap veriyor: bilinen Markov yapısı + bilinmeyen gözlem zinciri = çıkarılabilir gerçek.

Etiketler

gizli Markov modeliHMMkonuşma tanımabiyoinformatikViterbi algoritması

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. HMM (Gizli Markov Modeli) nedir?

2. Viterbi algoritması neyi çözer?

3. Baum-Welch algoritması neyi yapar?

4. HMM'in 1960-2000 arası ana uygulama alanı neydi?

5. Kalman filtresinin HMM ile bağlantısı nedir?