Graf Veri Dünyasında Devrim: Derin Öğrenmeyi Anlamanın Yeni Yolu

1. Giriş: Veri Artık Noktalardan İbaret Değil

Klasik tablo (tabular) verilerde her satır bağımsız bir gözlem olarak ele alınır ve satırlar arası ilişkiler genellikle modele doğrudan dahil edilmez. Oysa gerçek dünyadaki birçok problemde asıl bilgi, bu gözlemler arasındaki bağlantı yapısında saklıdır; graf yaklaşımı tam olarak bu eksikliği gidermeyi amaçlar. Günlük hayatta neredeyse her sistem birbiriyle bağlantılı yapılardan oluşur. Sosyal medyada arkadaşlık ilişkileri, şehirler arasındaki uçuş ağları, elektrik şebekeleri, protein–protein etkileşimleri ya da akademik makalelerin birbirine yaptığı atıflar… Bunların hepsi birer ağ yapısıdır. Yani dünyayı yalnızca tekil varlıklar üzerinden değil, bu varlıklar arasındaki ilişkiler üzerinden de anlamamız gerekir.

Veri biliminde bu ağ yapısına graf (graph) denir. Graflar iki temel bileşenden oluşur: düğümler (nodes) ve bu düğümler arasındaki bağlantılar (edges). Örneğin bir sosyal medya platformunda kullanıcılar düğüm, arkadaşlık ilişkileri ise kenardır. Bir ulaşım ağında şehirler düğüm, uçuşlar ise kenar olabilir.

Burada kritik nokta şudur: Çoğu zaman en değerli bilgi, tek bir düğümün özelliklerinde değil; düğümler arasındaki bağlantıların yapısında saklıdır. Modern veri bilimi bu nedenle yalnızca “özellik tabanlı” analizlerden uzaklaşarak, “ilişki tabanlı” analizlere yönelmiştir. Özellikle karmaşık sistemleri anlamada graf yaklaşımı büyük avantaj sağlar.

2. Graf Temsil Öğrenimi Nasıl Gelişti?

Bu evrim yalnızca teknik bir ilerleme değil, aynı zamanda önceki yöntemlerin sınırlamalarına verilen bir yanıttır. Her yeni aşama, bir önceki yaklaşımın ölçeklenebilirlik, temsil gücü veya otomatik öğrenme kapasitesi açısından yetersiz kalması nedeniyle ortaya çıkmıştır. Graf verilerini analiz etmek için geliştirilen yöntemler son on yılda önemli bir evrim geçirmiştir. Bu süreci üç temel aşamada inceleyebiliriz:

Geleneksel yöntemler: Bu dönemde graf özellikleri (derece, merkezilik, kümelenme katsayısı gibi) manuel olarak hesaplanır ve klasik makine öğrenmesi modellerine girdi olarak verilirdi.
Graf gömme (embedding) yöntemleri: DeepWalk ve node2vec gibi yöntemlerle düğümler düşük boyutlu sayısal vektörlere dönüştürülmeye başlandı. Böylece graf yapısı, makine öğrenmesi algoritmalarının anlayabileceği bir formata getirildi.
Graf Sinir Ağları (Graph Neural Networks – GNN): Derin öğrenme teknikleri doğrudan graf yapısına uygulanmaya başlandı. Model, grafın yapısını öğrenirken aynı zamanda düğümlerin özelliklerini de birlikte işler.

Bu gelişmeler sayesinde artık graf yapıları; görüntü verileri için CNN’lerin, metin verileri için RNN veya Transformer’ların oynadığı role benzer şekilde, özel sinir ağı mimarileriyle analiz edilebilmektedir.

Graf temsil öğrenimi bugün bilgisayar mühendisliği, biyoinformatik, sosyal bilimler, finans, siber güvenlik ve kimya gibi pek çok alanda aktif olarak kullanılmaktadır. Bu da konunun ne kadar disiplinler arası bir yapıya sahip olduğunu göstermektedir.

3. Yapısal Roller: Aynı Konum, Farklı Yer

Bu kavramı somutlaştırmak için küçük bir hayali ağ düşünelim: A, B ve C düğümleri birbirine bağlı küçük bir grup oluştursun. D ve E düğümleri de kendi aralarında bağlı başka bir küçük grup olsun. Şimdi A düğümü kendi grubunda merkezi bir konumda olsun; benzer şekilde D düğümü de kendi grubunun merkezinde yer alsın. A ve D birbirine bağlı olmasa bile, her ikisi de kendi topluluklarında “merkez” rolünü üstlendiği için yapısal olarak benzer kabul edilir. Bir graf içinde iki düğüm birbirinden fiziksel veya topolojik olarak çok uzakta olabilir. Ancak bu düğümler ağ içinde benzer bir role sahip olabilir.

Örneğin iki farklı ülkedeki büyük havalimanlarını düşünelim. Bu havalimanları birbirine doğrudan bağlı olmayabilir. Ancak her biri kendi bölgesinde ana aktarma merkezi (hub) görevini üstlenir. Bu nedenle yapısal olarak benzer bir konumdadırlar.

Burada iki kavramı ayırt etmek gerekir:

Topluluk (community): Birbirleriyle yoğun bağlantıya sahip düğüm grupları
Yapısal rol (structural role): Ağ içindeki işlevsel konum

İki düğüm aynı toplulukta olmayabilir; fakat aynı yapısal role sahip olabilir. Bu ayrım özellikle sosyal etki analizi, pazarlama stratejileri, finansal ağ analizi ve ağ güvenliği gibi alanlarda kritik öneme sahiptir. Çünkü bazen önemli olan kimin kiminle bağlı olduğu değil, ağ içinde hangi görevi üstlendiğidir.

4. Aşırı Pürüzsüzleşme (Oversmoothing) Nedir?

Sezgisel olarak, her adımda komşuların ortalamasını almak; farklı değerleri tekrar tekrar karıştırmak anlamına gelir ve bu tekrar eden karışım süreci zamanla tüm düğümlerin birbirine benzemesine yol açar. Derin öğrenmede yaygın bir düşünce vardır: Daha fazla katman, daha güçlü model anlamına gelir. Ancak Graf Sinir Ağları için bu yaklaşım her zaman geçerli değildir.

GNN’ler çalışırken bir düğümün temsilini komşularından gelen bilgilerle günceller. Her katmanda düğüm, çevresindeki düğümlerin özelliklerini “birleştirir” (aggregation). Katman sayısı arttıkça düğümler birbirine daha fazla bilgi aktarır.

Fakat model çok derin hale geldiğinde tüm düğümler benzer temsillere sahip olmaya başlar. Yani model, düğümler arasındaki farkları ayırt edemez hale gelir. Bu probleme oversmoothing (aşırı pürüzsüzleşme) denir.

Matematiksel olarak bakıldığında, tekrar eden komşu ortalamaları düğüm temsillerini belirli bir denge noktasına doğru yaklaştırır. Bu da ayırt ediciliğin azalmasına neden olur.

Bu nedenle GNN tasarımında yalnızca derinliği artırmak yerine; dikkat mekanizmaları, artık bağlantılar (residual connections) veya normalizasyon teknikleri gibi yöntemlerle denge kurulmalıdır.

5. Sosyal Denge Teorisi

Bazı graflarda bağlantılar yalnızca “var” veya “yok” şeklinde değildir. Bağlantılar olumlu (+) ya da olumsuz (–) olabilir. Örneğin arkadaşlık–düşmanlık, güven–güvensizlik gibi ilişkiler bu tür graflara örnektir.

Bu tür yapılarda Denge Teorisi (Balance Theory) önemli bir rol oynar. Teori basit bir sosyal gözleme dayanır:

“Dostumun dostu dostumdur.”

Matematiksel olarak bir döngü içindeki negatif bağlantı sayısı çiftse, o yapı dengeli kabul edilir. Eğer negatif bağlantı sayısı tekse, yapı dengesizdir.

Bu teori sayesinde sosyal ağlarda potansiyel çatışmalar, gruplaşmalar veya kopmalar analiz edilebilir. Özellikle sosyal medya platformlarında kullanıcı etkileşimlerini anlamada ve topluluk dinamiklerini incelemede önemli bir araçtır.

6. Gerçek Hayatta Nerelerde Kullanılır?

Graf Sinir Ağları ve graf analiz yöntemleri birçok farklı uygulama alanına sahiptir:

Düğüm sınıflandırma: Bir kullanıcının hangi ilgi alanına sahip olduğunu tahmin etmek
Bağlantı tahmini: Gelecekte kimlerin iş birliği yapacağını öngörmek
Öneri sistemleri: Kullanıcılara uygun içerik veya ürün önermek
İlaç geliştirme: Moleküllerin özelliklerini analiz etmek ve yeni bileşikler keşfetmek
Sahte haber tespiti: Bilginin yayılım modelini inceleyerek manipülatif içerikleri belirlemek
Siber güvenlik: Şüpheli ağ aktivitelerini tespit etmek

Bu örnekler graf yapılarının hem mikro ölçekte (moleküler düzeyde) hem de makro ölçekte (toplumsal ağlarda) ne kadar güçlü bir analiz aracı olduğunu göstermektedir.

7. Sonuç: Bağlantı Odaklı Bir Gelecek

Graf yaklaşımı bize yalnızca bağlantıları değil; aynı zamanda ağ içindeki yapısal rolleri, derin modellerde ortaya çıkan oversmoothing riskini ve sosyal sistemlerdeki denge dinamiklerini birlikte düşünmeyi öğretir. Bu kavramlar bir araya geldiğinde, karmaşık sistemleri hem daha doğru modelleyebilir hem de daha bilinçli yorumlayabiliriz. Graf teknolojileri, veriye bakış açımızda önemli bir paradigma değişimi yaratmıştır. Artık yalnızca verinin tekil özelliklerine değil, veriler arasındaki ilişkilere ve ağ yapısına odaklanıyoruz.

Yapay zekâ sistemlerinin gelecekte daha bağlantı temelli çalışacağı öngörülmektedir. Özellikle karmaşık sistemleri modellemede graf yaklaşımı temel bir araç haline gelmektedir.

Son olarak şu soruyu düşünebiliriz:

Eğer dünya bir ağ ise, siz bu ağın içinde hangi rolü oynuyorsunuz? Ve bu rol, sistemin bütününü nasıl etkiliyor?

8. Sorular – Cevaplar

Soru 1: Graf ile klasik tablo verisi arasındaki temel fark nedir?
Cevap: Tablo verisinde her gözlem bağımsız kabul edilirken, graf verisinde gözlemler (düğümler) arasındaki ilişkiler de modelin bir parçasıdır. Bu nedenle graf yaklaşımı, bağlantı bilgisini doğrudan hesaba katar.

Soru 2: Graf temsil öğrenimi neden önemlidir?
Cevap: Çünkü graf yapısını sayısal temsillere dönüştürerek makine öğrenmesi ve derin öğrenme modellerinin bu yapıyı anlayabilmesini sağlar.

Soru 3: Yapısal rol ile topluluk arasındaki fark nedir?
Cevap: Topluluk, yoğun bağlantıya sahip düğüm gruplarını ifade eder. Yapısal rol ise düğümün ağ içindeki işlevsel konumunu tanımlar. İki düğüm aynı toplulukta olmayabilir ancak aynı rolü üstlenebilir.

Soru 4: Oversmoothing problemi neden ortaya çıkar?
Cevap: Çünkü GNN’lerde her katmanda komşuların bilgisi ortalanarak birleştirilir. Katman sayısı arttıkça bu tekrar eden ortalama alma işlemi düğüm temsillerinin birbirine benzemesine neden olur.

Soru 5: Denge Teorisi pratikte ne işe yarar?
Cevap: Sosyal ağlarda potansiyel çatışmaları, gruplaşmaları ve dengesiz ilişkileri analiz etmeye yardımcı olur.

Soru 6: Graf Sinir Ağları hangi alanlarda kullanılır?
Cevap: Öneri sistemleri, sosyal ağ analizi, ilaç geliştirme, sahte haber tespiti ve siber güvenlik gibi birçok alanda aktif olarak kullanılmaktadır.

9. Kaynakça

Kipf, T. N., & Welling, M. (2017). Semi-Supervised Classification with Graph Convolutional Networks. International Conference on Learning Representations (ICLR).
Hamilton, W., Ying, R., & Leskovec, J. (2017). Inductive Representation Learning on Large Graphs (GraphSAGE). Advances in Neural Information Processing Systems (NeurIPS).
Perozzi, B., Al-Rfou, R., & Skiena, S. (2014). DeepWalk: Online Learning of Social Representations. ACM SIGKDD.
Grover, A., & Leskovec, J. (2016). node2vec: Scalable Feature Learning for Networks. ACM SIGKDD.
Xu, K., Hu, W., Leskovec, J., & Jegelka, S. (2019). How Powerful are Graph Neural Networks? International Conference on Learning Representations (ICLR).
Heider, F. (1946). Attitudes and Cognitive Organization. Journal of Psychology. (Denge Teorisi’nin temel çalışması)
Wu, Z., Pan, S., Chen, F., Long, G., Zhang, C., & Yu, P. S. (2020). A Comprehensive Survey on Graph Neural Networks. IEEE Transactions on Neural Networks and Learning Systems.

Graf Veri Dünyasında Devrim: Derin Öğrenmeyi Anlamanın Yeni Yolu

1. Giriş: Veri Artık Noktalardan İbaret Değil

2. Graf Temsil Öğrenimi Nasıl Gelişti?

3. Yapısal Roller: Aynı Konum, Farklı Yer

4. Aşırı Pürüzsüzleşme (Oversmoothing) Nedir?

5. Sosyal Denge Teorisi

6. Gerçek Hayatta Nerelerde Kullanılır?

7. Sonuç: Bağlantı Odaklı Bir Gelecek

8. Sorular – Cevaplar

9. Kaynakça

Önerilen Makaleler

HealthBench: Sağlıkta Yapay Zekâ Performansını Ölçmenin Yeni Dönemi

Yapay Zeka ile Hasta Deneyimi İyileştirme: Yapay Zekanın Hasta Memnuniyetini Artırmadaki Rolü

Sentetik Hasta Verisi: Klinik Çalışmalarda Kullanım ve Kalite Standartları