Knowledge Graphs: Yapılandırılmış Bilginin Anatomisi
Google'ın 2012'de tanıttığı, "şey değil string" felsefesinin somut hâli. Modern arama, soru-cevap ve RAG'in altyapı katmanlarından biri.

"Things, not strings"
16 Mayıs 2012. Google yeni özelliğini tanıttı: Knowledge Graph. Slogan:
"Things, not strings."
"Eğer 'Mona Lisa' aratırsan, sana sadece kelime eşleşmesi vermek istemiyoruz. Mona Lisa neyse onu vermek istiyoruz: tablo, ressam, müze, tarih, boyutlar."
Bu, semantik web vizyonunun pratik gerçekleşmesi. Tim Berners-Lee'nin 1990'larda hayal ettiği yapılandırılmış internet — Google ile geniş kitleye ulaştı.
Knowledge Graph — yapı
Knowledge graph = düğümler (entitiler) + kenarlar (ilişkiler):
- Düğüm: "Mona Lisa", "Leonardo da Vinci", "Louvre Müzesi"
- Kenar: "ressamı", "bulunduğu yer", "yapıldığı yıl"
Klasik RDF triple:
(Mona Lisa, ressamı, Leonardo da Vinci)
(Leonardo da Vinci, doğum yeri, Vinci)
(Mona Lisa, bulunduğu yer, Louvre)
Bu üçlüler birleşince bilgi grafı oluşur. Modern Google KG'ı 500+ milyar üçlü içerir.
Wikidata — açık alternatif
Wikidata (2012, Wikimedia Foundation): Wikipedia'nın yapılandırılmış kardeşi. Açık knowledge graph. Bugün 100+ milyon entity, 1.5 milyar üçlü.
Modern AI uygulamalarının çoğu Wikidata'dan veri çeker. Stable yapı:
- Q numaraları: Her entity için (Q5 = insan).
- P numaraları: Her ilişki için (P31 = "is a").
- SPARQL sorgu dili.
Bu sistem dilden bağımsız. "Cat" ve "kedi" aynı Q146'yı paylaşır.
Modern entegrasyonlar
Knowledge graph'lar modern AI'da çeşitli yerlerde:
Google Search
"Mona Lisa" arandığında sağ taraftaki kart — Google KG. Wikipedia + yapılandırılmış veri + medya.
Voice assistant'lar
Siri, Alexa, Google Assistant arkasında KG var. "Eyfel Kulesi ne kadar uzun?" — bu sorgu KG'a gider.
RAG sistemleri
Modern AI uygulamaları (Perplexity, ChatGPT Search) KG ile vektör veritabanını birleştirir. KG = kesin gerçekler. Vektör DB = anlamsal benzerlik.
Bilim
UMLS (tıbbi), Gene Ontology (biyolojik), ChEBI (kimyasal) — domain-specific KG'lar. AlphaFold ve ilaç keşfi bu KG'lardan faydalanır.
Graph Embedding
Knowledge graph'taki entityleri vektörlere çevirme — modern AI ile birleşme. Yöntemler:
- TransE (2013): Çok klasik. (head + relation = tail).
- ComplEx (2016): Karmaşık sayılarla.
- RotatE (2019): Döndürmeler.
Sonra GNN üzerine graph embedding (R-GCN, GAT). Modern KG entegrasyonunun standart yöntemi.
LLM ile birleşme
2023 sonrası eğilim: LLM'ler KG ile entegre edilmeli. Sebepler:
- Halüsinasyon azaltma: KG kesin gerçekler verir.
- Güncel bilgi: LLM eğitim tarihinden sonrasını bilmez; KG güncelleştirilebilir.
- Açıklanabilirlik: "Bu cevap şu üçlüden geliyor".
Yöntemler:
- GraphRAG (Microsoft, 2024): RAG'in KG ile birleşmesi.
- Knowledge editing: Modelin bir gerçeği değiştirme.
- KG-augmented LLM: Soru sırasında KG sorgusu.
Sorunlar
Knowledge graph yaklaşımları zorlukları:
- Veri ekleme pahalı. İnsan + AI hibrit etiketleme.
- Eksiklik: KG hiçbir zaman tam değil.
- Belirsizlik: Bazı gerçekler "kesin" değil.
- Çelişki: Farklı kaynaklar farklı söyler.
LLM'lerin yumuşak bilgisi ile KG'nin kesin bilgisi birleşimi modern AI mühendisliğinin temel sorunlarından.
Klasik benzetme
Bir kütüphane düşün. Klasik kütüphane: rastgele duran kitaplar. Modern kütüphane: kataloglu kitaplar. Yazar adına göre, konu başlığına göre, yayın yılına göre aranabilir.
Knowledge graph internetin katalogudur. Web sayfaları yan yana atılmış kitaplar; KG bunları yapılandırır. Modern arama ve AI bu yapıdan faydalanır.
Sade ders
Knowledge graph hikâyesinden iki şey:
- Yapılandırılmış ve serbest bilgi tamamlayıcıdır. LLM'ler doğal dil, KG'ler kesin gerçekler. Modern AI ikisini birleştirir. Tek bir paradigma yok — karma sistemler kazanır.
- Eski fikirler yeni bağlamda dirilir. Semantic web Tim Berners-Lee'nin 1990'lar vizyonuydu. 30 yıl sonra modern LLM ekosisteminde yeniden merkez. Eski vizyonlar bekler.
Bağlam
GNN için: [[graph-neural-networks-iliskilerin-sinir-aglari]]. RAG için: [[vektor-veritabanlari-faiss-pinecone-rag-in-omurgasi]]. Modern semantik arama için: [[aravind-srinivas-perplexity-ai-ile-arama-i-tekrar-yazmak]]. Function calling ile birleşim: [[function-calling-llm-ye-arac-vermek]]. Halüsinasyon problemi için: [[adversarial-examples-sinir-aglarinin-sinir-bozucu-zayifligi]].
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Knowledge graph nedir?
2. Google Knowledge Graph ne zaman tanıtıldı?
3. Wikidata nedir?
4. TransE neyi modeller?
5. Knowledge graph ile LLM birleşimi niye önemli?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?