Veri Analizi Nedir?

Veri analizi (DA), içerdiği bilgiler hakkında giderek artan bir şekilde, özel sistemler ve yazılımların yardımıyla, veri kümelerini inceleme sürecidir. Bilimsel modelleri, teorileri ve hipotezleri doğrulamak veya çürütmek için kurumların daha bilinçli iş kararları almaları ve bilim adamları ve araştırmacılar tarafından sağlanması için veri analiz teknolojileri ve teknikleri olarak kullanılmaktadır. Bir terim olarak, veri analizi ağırlıklı olarak temel iş zekâsı (BI), raporlama ve çevrimiçi analitik işlemden ( OLAP ) çeşitli gelişmiş analitik formlarına kadar çeşitli uygulamalara atıfta bulunmaktadır. Veri bütünlüğünü sağlamanın önemli bir bileşeni, araştırma bulgularının doğru ve uygun analizidir.

Veri Analizi Nasıl Yapılır?

Veri analizi, iş zekâsının türetilmesi için daha büyük bir sürecin bir parçasıdır. İşlem, aşağıdaki adımlardan bir veya daha fazlasını içerir:

Hedeflerin Tanımlanması: Herhangi bir çalışma, açıkça tanımlanmış iş hedefleri kümesiyle başlamalıdır. Sürecin geri kalanında alınan kararların çoğu, çalışmanın amaçlarının ne kadar açık bir şekilde ifade edildiğine bağlıdır.

Soru Sorma: Problem alanında bir soru sormak için girişimde bulunulur. Örneğin, kırmızı spor otomobiller kazalara diğerlerinden daha sık giriyor mu?

Veri Toplama: Soruyla ilgili veriler uygun kaynaklardan toplanmalıdır. Yukarıdaki örnekte, veriler, DMV veya polis kaza raporları, sigorta tazminatları ve hastanede kalma ayrıntıları gibi çeşitli kaynaklardan toplanabilir.

Veri Sarma: Ham veriler birkaç farklı biçimde toplanabilir. Toplanan veriler temizlenmeli ve dönüştürülmeli, böylece veri analiz araçları bunları alabilir. Örneğimiz için, DMV kaza raporlarını metin dosyaları, ilişkisel bir veri tabanından sigorta talepleri ve bir API olarak hastaneye yatma ayrıntıları olarak alabiliriz. Veri analisti bu farklı veri formlarını bir araya getirmeli ve analiz araçları için uygun bir formata dönüştürmelidir.

Veri Analizi: Temizlenmiş ve birleştirilmiş verilerin analiz araçlarına aktarıldığı adımdır. Bu araçlar, verileri keşfetmenize, içinde kalıpları bulmanıza ve soru sorup soru sorup yanıtlamanıza olanak tanır. Bu, istatistiksel yöntemlerin doğru bir şekilde uygulanmasıyla araştırmada toplanan verilerin mantıklı olduğu süreçtir. Sonuçların Çizilmesi ve Tahminlerin Yapılması: Bu, yeterli analizden sonra, verilerden çıkarılan sonuçların alınabileceği ve uygun tahminlerin yapılabileceği adımdır. Bu sonuçlar ve tahminler, son kullanıcılara sunulan bir raporda özetlenebilir.

Büyük Veri Analizi

Büyük veri analizi, gizli modelleri, bilinmeyen korelasyonları, pazar eğilimlerini, müşteri tercihlerini ve diğer yararlı iş bilgilerini ortaya çıkarmak için büyük veri kümelerini inceleme sürecidir. Analitik bulgular daha etkili pazarlama, yeni gelir fırsatları, daha iyi müşteri hizmetleri, iyileştirilmiş operasyonel verimlilik, rakip kuruluşlar ve diğer ticari faydalara göre rekabet avantajları sağlayabilir. Büyük veri analitiğinin temel amacı, veri işçileri, tahmin modelleyicileri ve diğer analitik profesyonellerinin büyük hacimli işlem verilerini ve geleneksel iş zekâsı tarafından kullanılmayan diğer veri türlerini analiz etmelerini sağlayarak şirketlerin daha bilinçli iş kararları vermelerine yardımcı olmaktır. Yarı yapılandırılmış ve yapılandırılmamış veri, ilişkisel veri tabanlarına dayalı geleneksel veri ambarlarına iyi sığmayabilir. Ayrıca veri ambarları, sık sık ve hatta sürekli olarak güncellenmesi gereken büyük veri setlerinin ortaya koyduğu işleme taleplerini, örneğin mobil uygulamaların veya petrol ve gaz boru hatlarının performansına ilişkin gerçek zamanlı verilerle idare edemeyebilir. Sonuç olarak, büyük verileri toplayan, işleyen ve analiz eden birçok kuruluş, Hadoop ve YARN, MapReduce, Spark, Hive ve Pig gibi NoSQL veri tabanları gibi ilgili araçları içeren yeni bir teknolojiye dönüştü. Bu teknolojiler, kümelenmiş sistemlerde büyük ve çeşitli veri kümelerinin işlenmesini destekleyen açık kaynaklı bir yazılım çerçevesinin çekirdeğini oluşturur. Bazı durumlarda, Hadoop kümeleri ve NoSQL sistemleri, veri için bir veri ambarına yüklenmeden önce, genellikle ilişkisel yapılara daha elverişli özetlenen bir biçimde, veri tabanları ve veri toplama alanları olarak kullanılır.



Bir Cevap Yazın