10.07.2016 18:47:39
Big Data (Büyük Veri) Üzerine Sorular - 2
SORU: Büyük Veri (Big Data) Hangi Bileşenlerden Oluşur?
Büyük Veri (Big Data); Mevcut bilgi teknolojilerinin işleyemeyeceği kadar BÜYÜK (Big/Volume) ve KARMAŞIK(Complex) olan ve öncesinde ANALİZİ MÜMKÜN OLMAYAN büyüklük, ÇEŞİTLİLİK(Variety) ve AKIŞKANLIKTAKİ (Streaming) bilgiye erişim için yeni yetkinlikler gerektiren veri kümeleri olarak adlandırılır şeklinde tanımlamıştık.
Tanımını yaptığımız Büyük Veri, tanım içinde bileşenlerini de açıklamaktadır. Genel olarak Big Data 5 bileşenden oluşur ve literatürde bu bileşenlere 5V denilmektedir. Bunlar;
- Variety (Çeşitlilik)
- Velocity (Hız)
- Volume (Veri Büyüklüğü - Veri Hacmi)
- Validation (Doğrulama)
- Value(Değer)
5V bu bileşenlerin baş harflerinde bulunan V ile oluşan bir kavramdır.
Big Data; Bu bileşenler ile çeşitli teknolojilerin bir arada kullanılmasıyla ortaya çıkan bir süreç olarak adlandırılabilir.
Çünkü üretilen verilerin %80'ine yakını yapısal veri değildir. Kullandığımız telefondan, tabletlere, tabletlerden entegre devrelere farklı formatlarda veri üretilmektedir. Bu nedenle bütünleşik ve birbirine dönüşmeleri gerekli olmaktadır. (Variety)
Googledan yapılan bir açıklamaya göre; İnsan oğlunun varoluşundan 2000 yıllara kadar üretilen tüm veri, 2000 yılı itibariyle 2 günde üretilebilecek kapasiteye ulaştığı; 2010 itibariyle de mevcut üretilen verinin 2020'li yıllarda mevcut verinin 44 katı büyüklüğünde olacağı belirtildi. Dolayısıyla şirketlerin; hacmi büyüyen bu verileri arşivleme, depolama ve bütünleştirme ile yapacağı yatırımlar paralel olmak zorundadır. (Volume)
Hızlı bir şekilde hacmi artan ve büyüyen bu verinin de aynı büyüklükte ve hızda analiz edilmesine ve işlem yapabilmesine ihtiyaç doğmaktadır. ( Velocity)
Hızlı büyüyen bu verinin aynı hız ile analizi yapılıp anlamlı bir veriye dönüştürülme sürecinde verinin akışı sırasında güvenli bir biçimde doğru kişi ve kaynaklara aktarılması gerekmektedir. (Validation)
Bu bileşenlerin doğru şekilde ve istenilen şekilde işlenmesiyle Big Data anlam kazanarak bir DEĞER kazanmaktadır. ( Value )
İşte tüm bu bileşenler bir araya getirilerek insanlar için anlamsız gibi görünün veriler; Yapısal Verilerin Analizi ( Dataware housing - Veri Ambarı), Yapısal Olmayan Verilerin Analizi (Text Analytics Engine), Akışkan Verilerin Yönetimi (Stream Computing), her çeşit büyük veriyi saklama ve yönetimi (Hadoop File System MapReduce) bu belirtilen teknoloji ve tekniklerle birer anlamlı veriye dönüştürülmüş olur.
Büyük veri (Big Data) dediğimiz olay bu sürecin tam kendisidir.
Faydalı olması temennisiyle
Saygılarımla
Bil.Müh.Muhammed ÖNAL