LLM'lere harici bilgi tabanı erişimi — eğitim verisi dışındaki bilgiler için

RAG'ın dört temel adımı?

İndexleme + sorgu embedding + retrieval + LLM yanıt

Modern embedding modelleri nelerdir?

OpenAI ada-002, Sentence-BERT, BGE, NV-Embed

RAG'ın felsefi anlamı nedir?

Bilgi modelin içinde değil, dışında — LLM akıl yürütme motoru, bilgi harici kütüphane

RAG: Retrieval-Augmented Generation — LLM'lere Güncel Bilgi Bağlamak

"LLM 2024 olaylarını bilmez"

Bir LLM'in eğitim tarihi vardır:

GPT-4: bilgi cutoff Nisan 2023.
Claude 3.5: cutoff Nisan 2024.
DeepSeek V3: 2024.

Sorduğunuz şirket içi belgeler veya güncel haberler model bilmez.

Klasik çözüm: fine-tuning. Ama:

Yavaş, pahalı.
Her yeni belgede tekrar gerekli.
Bilgi güncellemesi zor.

Daha iyi yol: RAG (Retrieval-Augmented Generation).

RAG'ın temel adımları

1. Belge işleme (indexleme)

Belgeler parçalara ayrılır (chunks, ~500 token).

Her parça embedding ile vektöre dönüştürülür.

Vektörler vector database'e kaydedilir.

2. Sorgu zamanı

Kullanıcı sorgu gönderir.

Sorgu da embedding'e dönüştürülür.

En benzer parçalar vector database'den çekilir (top-k).

3. Bağlam zenginleştirme

Bulunan parçalar + sorgu + sistem talimatları → LLM prompt.

4. Yanıt üretimi

LLM bağlamı kullanarak cevap verir.

Embedding ne demek?

Embedding: metni vektöre dönüştüren model.

"kedi" → [0.23, -0.45, 0.12, ...] (768 boyutlu).
"köpek" → [0.21, -0.40, 0.18, ...] (yakın).
"araba" → [0.55, 0.12, -0.33, ...] (uzak).

Anlamsal benzerlik = vektör benzerliği.

Modern embedding modelleri:

OpenAI ada-002.
Sentence-BERT.
BGE (BAAI).
NV-Embed.

Vector database

Vektörleri hızlı arama için özel veritabanı:

Pinecone, Weaviate, Chroma.
Milvus, Qdrant.
PostgreSQL pgvector.

ANN (Approximate Nearest Neighbor) algoritmaları: HNSW, IVF.

Tarihsel köken

Lewis et al. (Facebook, 2020): "Retrieval-Augmented Generation for Knowledge-Intensive NLP".

Modern RAG paradigmasının başlangıcı.

Bundan önce: kQA, ORQA gibi öncül modeller.

Modern uygulamalar

1. Enterprise AI

Şirket içi belgeler.
Müşteri destek bilgi tabanı.
Yasal belgeler.

2. Programlama

Cursor, Copilot: kod tabanından bilgi.
GitHub Copilot Workspace.

3. Akademik

Elicit, Consensus: bilimsel makale arama.

4. Müşteri hizmetleri

ChatGPT-tipi chatbot + şirket bilgi tabanı.

5. Tıbbi

MedPaLM: tıbbi literatür.

6. Hukuki

Lexis+ AI.

Modern teknikler

Hybrid retrieval

Embedding + keyword (BM25) arama birlikte.

Re-ranking

Top-k'yı tekrar re-ranker ile sırala.

Self-RAG

Model kendi yanıtının doğruluğunu kontrol eder.

GraphRAG (Microsoft)

Bilgi grafı + RAG kombinasyonu.

Multi-hop reasoning

Birden fazla bilgi noktasını birleştirme.

Sınırlamalar

Bağlam penceresi: kaç belge eklenebilir?
Retrieval kalitesi: kötü embedding → kötü cevap.
Hallusinasyon: model bağlamı görmezden gelebilir.
Latency: ekstra arama adımı.

Modern alternatifler

Long context windows: tüm belgeyi prompt'a koy.
In-context learning: few-shot prompting.
Agentic search: model kendisi arama yapar.

Felsefi anlamı

RAG: "Bilgi modelin içinde değil, dışında".

Modern AI mimarisinin felsefesi: model akıl yürütme motoru, bilgi harici kütüphane.

İnsan analojisi: doktor tıp kitabını ezberlemez, arar.

Sonuç

RAG:

Embedding + vector database + LLM zinciri.
Lewis et al. (2020) modern paradigma.
Enterprise AI'nin standardı.
Akademik, hukuki, tıbbi uygulamalar.

Modern AI ekosistemindeki kritik mimari. LLM'leri statik bilgiden dinamik bilgiye taşıyan teknik.

"Bilgiyi modele koymak yerine, modele bilgiyi göster." RAG'ın paradigması.