Kategoriler
Graph Veri Tabanı Sistemi İlişki Odaklı Veri Analizi

Veri Analitiğinde Geleneksel Yöntemler Son Buluyor: Geleceğin Analiz Teknolojisi Graph Analitiği

Son on yılda büyük veri kavramının hızlı yükselişiyle birlikte gündeme gelen teknolojilerden biri de graph (çizge) veri tabanları.

Artan veri büyüklüğü ile bu verilerin analiz edilmesi ve veriler arasındaki bağıntıların ortaya çıkarılmasında graph veri tabanlarının etkisi sıkça konuşuluyor. Bu etkiyi çok spesifik sektörlerde aramaya gerek yok; örneğin sosyal medya platformlarıyla birlikte “social network”, “tanıyor olabileceğin kişiler” ve “bu videoyu beğenenler bunları da beğendi” gibi öneriler graph veri tabanlarının hayatımızdaki yansımalarından birkaçı.

Graph, varlıkları temsil eden düğümler (node) ve bu varlıklar arasındaki ilişkileri temsil eden kenarlar (edge) veya bağlantılardan oluşur. Graph analitiği ise, varlıkları ayrı ayrı temsil eden bir modele ve bu varlıkları düğümlerle birbirine bağlayan çeşitli ilişki türlerinin analizine dayanır.

Graph teknolojileri, geleneksel veri analitiği yöntemleriyle tespiti zor ve neredeyse imkânsız olan verilerin arasındaki ilişkilerin kolayca ortaya çıkarılmasını sağlıyor.  Gartner, graph teknolojisinin kullanıcı iş birliğini, makine öğrenimi modellerini ve açıklanabilir yapay zekayı geliştirme ve iyileştirme yetenekleriyle modern veri analitiğinin temelini oluşturduğundan bahsediyor. Ayrıca, müşterilerinin yapay zekâ ile ilgili sorularının yarısının graph teknolojisinin kullanımıyla ilgili olduğunu belirtiyor ki yapay zekâ konusundaki faaliyetlerin yoğunluğunu baz alırsak bu oldukça yüksek bir oran. Veri analistleri, karmaşık iş sorunlarının hızlı çözümü için graph teknolojisine güveniyor. Dolayısıyla yine Gartner tarafından yapılan bir tahmine göre 2021’den 2025 yılına kadar veri ve analitik çözümlerinde graph teknolojilerinin kullanım oranının %10’dan %80’e yükseleceğini öngörülüyor.

Peki nedir bu graph veri tabanlarının klasik veri tabanlarından farkı? Belirttiğimiz gibi graph veri tabanları, matematikteki graph teorisinden faydalanarak veriyi node ve edge olarak tutuyor. Böylece, uzun zaman alacak karmaşık hesaplamalar, komşuluk matrislerinin taranmasıyla ilişkisel veri tabanlarındaki ilişki arama işlemlerinden çok daha hızlı ve düşük maliyetli sonuçlar üretiyor. Daha detaylı anlatacak olursak, iki node arasındaki en kısa yolun bulunması, centrality analizleri ve traverse işlemleri gibi ilişkisel veri tabanları üzerinden yapılması neredeyse imkânsız işlemler, graph veri tabanları üzerinde saniye altında tamamlanabiliyor.

Sektöre yön veren birçok kaynağın graph analitiği kavramının önümüzdeki yıllarda en önemli analitik trendleri arasında yer alacağını belirttiğinden bahsetmiştik. Veri sahiplerinin, ellerindeki veri hacminin artmasıyla, klasik yöntemlerle yürüttükleri analizlerin yetersiz olduğunu fark etmesi ve bu eksiklikleri graph yaklaşımıyla tamamlamaya başlaması, bu yaklaşıma verilen önemi artırıyor.

Her tür veri graph analizi için uygun mu? Bu teknoloji ile ne tür analizler yapılabilir?

Aslında graph teknolojilerinin bu kadar popüler olmaya başlamasının en önemli sebeplerinden biri de graph modellerinin gerçek hayat olaylarını betimleyebilme gücünün daha yüksek olması. Hem sorgulama dili yaklaşımı (gremlin, cypher, DQL) hem de verinin görselleştirme aşaması bu noktada yoğun bir anlatım farkı yaratıyor. Klasik ilişkisel veri tabanlarında veri, tablolar üzerinde fiziksel olarak ayrıştırılırken, graph veri tabanlarında mantıksal olarak ayrılıyor. Bu da elinde mantıksal bağlantıları olan verilere sahip herkesin graph teknolojilerinden çözüm üretebilmesine olanak tanıyor. Diğer yandan veri madenciliği teknikleri sayesinde IT uzmanları yerine analistler hızlı değer üretebiliyor, böylelikle süreçler çok daha hızlı ilerleyebiliyor.  Özellikle suç analitiği, network analizi, çeşitli para hareketlerinin izlenmesi gibi konularda graph teknolojileri çok etkili çözümler üretiyor, ki günümüzde bu sektörler bu teknolojiden aktif olarak faydalanıyor.

Uzun yıllar ilişkisel veri tabanlarında tutulan verilerle graph analitiği yapılabilir mi?

Bu durum maalesef kurumları zorlayan nokta, çünkü pazardaki ürünlerin çoğu verilerinizi bir graph veri tabanına taşımaya yönlendiriyor. Bu noktada IT karar vericileri büyük veriyi hareket ettirmenin maliyetini ve ETL süreçlerini düşünüyor. Ayrıca sürekli olarak beslemek zorunda oldukları yeni veri kaynağına da mesafeli yaklaşıyor. Sektörün bu alanda bilinen ürünleri kendilerini ACID desteğiyle neredeyse ilişkisel veri tabanlarının tam bir ikamesi olarak konumlandırarak kişileri ürünlerine yönlendirmeye çalışıyor.  Ancak bu tür vaatler IT uzmanlarını ikna etmiyor.       

Siz de sektörünüz ve amacınıza yönelik en modern veri analitiği yaklaşımı graph analitiğinden faydalanmak istiyorsanız bizimle iletişime geçebilirsiniz.  

Kaynaklar:

Gartner

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir