Günümüzde internet kullanımın artması ve teknolojik gelişmelerin hız kazanması ile birlikte her gün çok fazla miktarda veri elde edilmekte. Dünyada bir günde 2,5 kentrilyon byte veri üretiliyor. Gelecek 10 yılda bu rakamın 44 katına ulaşması ön görülmekte.

Bu verilere en büyük katkıyı sosyal medya hesaplarımızdaki yaptığımız paylaşımlarla, internette gezinirken yaptığımız tıklamalarla, bloglarla vb. kaynaklardan toplanan tüm veriler ile biz yapmaktayız. Bizim katkılarımızla beraber RFID etiketleri ve sensör teknolojileri de sürekli olarak veri toplamakta.

Bu verilerin büyük çoğunluğu yapılandırılmamış veriler olduğu için yakın zamana dek “bilgi çöplüğü” olarak düşünülüyordu. Doğru şekilde analiz edilerek yorumlandığında şirketlerin doğru stratejik kararlar alabilmesine ve risk yönetimlerini iyi bir şekilde yapabilmelerini sağladığı görülene dek.

Big Data 5V olarak adlandırılan 5 bileşenden oluşmaktadır.

Bunlar;

  • Variety (çeşitlilik) : Telefonlardan, tabletlerden ve yeni teknolojilerden farklı dillerde farklı formatlarda yapılandırılmış ve yapılandırılmamış veri üretiliyor. Bu veriler bütünleşik ve birbirlerine dönüşebilir olmalı.
  • Velocity (hız) : Veriler gittikçe daha da hızlı bir şekilde artmakta, bu da verinin işlem sayısı ve çeşitliliğinin de aynı şekilde artmasına sebep oluyor. Bu hızla her yönden başa çıkabiliyor olmalıyız.
  • Volume (veri büyüklüğü) : Artan hızla beraber verilerde daha da büyümekte bu verileri depolama için gerekli teknolojik gelişimlerin sağlanmalı.
  • Verification (doğrulama): Bu kadar büyüyen veri güvenilir olmalı ve doğru kişiler tarafından görülebilir olmalı.
  • Value (değer) : Oluşan bu verilerin şirket için bir katma değer sağlaması gerekli. Stratejik olarak vereceğimiz kararlarda etki ediyor olmalı.

Büyük veriyi önemli kılan, firmamızın ne kadar fazla bilgi sahibi olmasından daha çok bu bilgiyi doğru şekilde kullanılmasıdır. Doğru yorumlama maliyetin düşmesinde, zamandan kazanç sağlamamızda ve stratejik kararlar vermemizde artı yönde etki ediyor.

 

Big Data’yı Hangi Alanlarda Kullanmaktayız?

Büyük veriyi endüstride her sektörden şirket, doğru analiz ederek kullanabilir. Bununla ilgili birkaç sektörden küçük örneklerle anlatacağım.

  • Online alış-veriş siteleri internette yapmakta olduğumuz aramalar, sosyal medyada ki paylaşımlarımız ve kişisel bilgilerimize göre giriş sayfası oluşturmakta. Aynı şekilde, Google’daki reklamlarında da bu bilgileri kullanarak doğru kişiye ulaştırabilmekte.
  • İlaç sanayisinde ise bir hastalığın tedavisi için yapılan araştırmalar ortak bir veritabanında araştırmacıların sürekli ulaşımına açık bir şekilde tutulmakta.
  • Bankacılıkta kredi alacak müşterinin sadece geriye dönük finansal hareketleri dışında günlük alışkanlıkları ve sosyal medya paylaşımlarını da dikkate alarak limit belirleyebilecek. Aynı zamanda bu verileri kullanarak alacağı yeni kurallar ile dolandırıcılığı ve riski aza indirgeyebilecek.
  • Hükümetler vatandaşlarına yönelik toplayacağı verilerle trafik sorunlarında, güvenlik konusunda çözüm üretebilir. Kurumları yönetmede ve hizmet sağlamada yeniliklere gidebilir.

 

Bu verileri bir yerde tutabilmemiz gerekli, Google milyarlarca sayfayı Google File System de tutuyor. Yazılımcılar açık kaynaklı olarak Lucene, Solr, Hadoop, HBase gibi başarılı kullanabilir projeler yazmakta.

Teknolojik her gelişmede olduğu gibi özel hayatın gizliliği ve firmaların gizlilik politikaları için sorun oluşturabilme ihtimalide göz ardı edilemez elbette. Bu yönde de çalışmalar yapılmakta ve ayrı bir mesleki dal gelişmiş durumda.

 

Dünyada birçok ülke ve şirket büyük veri yatırımlarını artırıyor.

Bu ülkeler arasında olan Çin de, 2020’ye kadar ülkedeki büyük veri endüstrisini %30 büyütmek için 10 büyük veri şirketine, 500 büyük veri bağlantılı yatırıma destek verecek.

Büyük veri gün geçtikçe daha da hızlı bir şekilde artmaya devam edecek. Daha fazla geç olmadan hem bireysel olarak hem firmalar olarak hem de ülke olarak gerekli gelişim düzenine geçmeliyiz…