HMM (Gizli Markov Modeli) nedir?

İki seviyeli model: gizli Markov durum dizisi + her durumun gözlem üretmesi

Viterbi algoritması neyi çözer?

En olası gizli durum dizisini — dinamik programlama ile $O(T \cdot N^2)$

Baum-Welch algoritması neyi yapar?

HMM parametrelerini ($\pi, A, B$) gözlem verisinden iteratif olarak öğrenir; EM'in HMM özel hali

HMM'in 1960-2000 arası ana uygulama alanı neydi?

Konuşma tanıma — her fonem bir gizli durum, ses sinyali gözlem; modern derin öğrenmeden önce standart

Kalman filtresinin HMM ile bağlantısı nedir?

Sürekli, Gauss dağılımlı durum + gözlem ile HMM'in özel hali; roket güdümünden GPS'e standart araç

Tüm yazılar

Matematik29 Temmuz 2025

Gizli Markov Modelleri (HMM): Konuşma Tanımadan Genetiğe Dijital Çağın Gizli İşletmecisi

Bir mikrofonun aldığı ses sinyali — ama altında konuşulan **kelimeler ne**? Bir DNA dizisi — ama hangi bölgesi **gen**, hangisi **gürültü**? HMM, bu "**altta yatan gizli durum**" çıkarımının matematiği. Modern AI öncesi standartdı.

Matematik Karavanı Editörü 6 dk okuma 5 soru

Mikrofon ve ses dalgaları — HMM'in klasik uygulaması

"Altta yatan gerçek ne?"

Bir mikrofon ses sinyali aldı. Ama bu sinyalin altında konuşulan kelimeler ne? Bunu bilmek istiyoruz.

Veya: DNA dizisinde gen bölgeleri ile junk DNA birbirine girmiş. Hangi nükleotidin nereye ait olduğunu görmüyoruz.

Veya: bir hisse senedinin fiyat dalgalanmaları gözlenebilir, ama piyasanın "hidden" durumu ("bull" vs "bear" pazarı) görünmez.

Bu üç soru aynı matematik yapıya sahip: gözlemlenebilir veriden gizli durum çıkarımı. Çözümü: Gizli Markov Modeli (Hidden Markov Model, HMM).

HMM nedir?

İki seviyeli bir model:

Gizli durumlar $S_1, S_2, \ldots, S_T$ : bir Markov zinciri (görünmüyor).
Gözlemler $O_1, O_2, \ldots, O_T$ : her gizli durum bir gözlem üretir (görünüyor).

Parametreler:

Başlangıç olasılığı $\pi_i = P(S_1 = i)$ .
Geçiş olasılığı $a_{ij} = P(S_{t+1} = j \mid S_t = i)$ .
Emisyon olasılığı $b_{i}(o) = P(O_t = o \mid S_t = i)$ .

Klasik örnek — sıcaklık ve dondurma

Bir gözlemci sadece kaç dondurma yendiğini görüyor: $O_t \in \{0, 1, 2, 3\}$ . Hava durumu gizli: $S_t \in \{\text{sıcak}, \text{soğuk}\}$ .

Geçiş olasılıkları: $P(\text{sıcak} \to \text{sıcak}) = 0.7$ , $P(\text{sıcak} \to \text{soğuk}) = 0.3$ , vs.

Emisyon: sıcak günde 3 dondurma yeme olasılığı 0.5; soğuk günde 0.

Şimdi gözlem dizisi $O = (3, 2, 0, 1, 3)$ verildiğinde, sıcaklık durumu dizisi $(S_1, ..., S_5)$ ne olmuştur?

Bu HMM çıkarım problemlerine ait.

Üç temel problem

1. Olasılık hesabı (Forward)

$P(O \mid \lambda)$ — gözlem dizisinin model verildiğindeki olasılığı.

Forward algoritması ile $O(T \cdot N^2)$ zamanda ( $N$ = gizli durum sayısı).

2. En olası gizli dizi (Decoding)

$\arg\max_S P(S \mid O, \lambda)$ — en muhtemel gizli dizi.

Viterbi algoritması (1967): dinamik programlama. $O(T \cdot N^2)$ .

3. Parametre öğrenimi (Learning)

Verilen $O$ kullanarak $\lambda = (\pi, A, B)$ tahmin et.

Baum-Welch algoritması (1966) — EM'in HMM özel hali. İteratif.

Viterbi algoritması — detay

Dinamik programlama:

$\delta_t(j) = \max_{i} \delta_{t-1}(i) \cdot a_{ij} \cdot b_j(O_t)$

$\delta_t(j)$ = en muhtemel yolun $t$ -inci adımda $j$ durumunda olma olasılığı.

Geri izleme: en yüksek $\delta_T$ 'den başlayıp geri yön ile en iyi gizli dizi.

Andrew Viterbi (1967): asıl ihtiyaç dijital iletişim (kod çözme). Modern her cep telefonu, modem, DVD'lerin Reed-Solomon kod çözücüsü Viterbi kullanır.

Uygulamalar

1. Konuşma tanıma

1960-2000 arası konuşma tanımanın altın çağı HMM'di. Her fonem bir gizli durum, ses dalgası gözlem.

Modern derin öğrenme (Wav2Vec, Whisper) HMM'i 2020'lerde büyük ölçüde yendi, ama HMM hâlâ pratik baseline.

2. Biyoinformatik

Gen tanıma: DNA dizisinde gen bölgelerini bulma. HMMler (PROFILER, GENSCAN) genetik araştırmanın temel araçları.

Protein dizisi hizalama: HHsearch, HHblits.

3. Doğal dil işleme

Part-of-speech tagging: her kelimenin sözcük türü. Modern transformer öncesi HMM standardı.

Naive Bayes / HMM klasik metin sınıflandırma.

4. Finans

Volatilite rejim algılama: piyasa "bull" mu "bear" mı? HMM klasik.

5. Robotik ve takip

Robot lokalizasyonu: belirsiz sensörlerden konum çıkarımı. Kalman filtresi = sürekli HMM özel hali.

6. Müzik analizi

Notalar dizisinin temel yapısı (akor değişimleri, tonalite).

Tarihsel köken

Andrei Markov (1913): Markov zincirleri.
Leonard Baum, Lloyd Welch (1966): Baum-Welch algoritması ve HMM kavramı, IDA (Institute for Defense Analyses).
Andrew Viterbi (1967): Viterbi algoritması.
L.R. Rabiner (1989): ünlü tutorial — HMM'i konuşma tanıma çevresine yaydı.

Modern alternatifler

HMM'in eksiklikleri modern derin öğrenme ile aşıldı:

RNN, LSTM, GRU (2010'lar): uzun bağımlılıkları daha iyi yakalar.
Transformer (2017'den beri): dikkat mekanizmasıyla HMM'in ötesine geçer.
CNN (görüntü gözleminde).

Yine de HMM:

Yorumlanabilir (gizli durumlar anlamlı).
Az veri ile çalışır.
Az hesap gerektirir.
Baseline olarak hâlâ değerli.

Sürekli HMM — Kalman filtresi

Eğer gizli durumlar sürekli ve Gauss dağılımlı ise:

Geçiş: lineer + Gauss gürültü.
Emisyon: lineer + Gauss gürültü.

Bu, Kalman filtresi (1960). Roket güdümünden GPS'e standart araç.

Sonuç

Gizli Markov Modelleri:

Modern dijital çağın görünmez işletmecisi.
"Gözlemlenebilir veri + gizli yapı + Markov varsayımı" formülü.
Viterbi, Forward-Backward, Baum-Welch algoritmalarıyla pratik.
Konuşma tanıma, biyoinformatik, finans, robotik uygulamaları.
Modern derin öğrenmenin öncüsü ve baseline'i.

Bir kişi telefon aramaları yaparken, Whatsapp sesli mesaj atarken, Spotify önerilerini alırken, Maps'te konumu görürken — HMM ya doğrudan ya da onun devamı olan modellerden geliyor.

1966'da Leonard Baum ve ekibinin gizli askeri tesislerde geliştirdiği bu model, 60 yıl sonra dijital çağın temel taşı oldu.

"Görünenin altında ne var?" Soru insan zekasının en eski sorularından biri. HMM matematik cevap veriyor: bilinen Markov yapısı + bilinmeyen gözlem zinciri = çıkarılabilir gerçek.

Etiketler

gizli Markov modeliHMMkonuşma tanımabiyoinformatikViterbi algoritması

İlgili Yazılar

Matematik