Sağlıktan finansa, eğitimden ticarete kadar pek çok alanda “büyük veri” yaygın biçimde kullanılıyor. Uzmanlar, “büyük veri”nin ehemmiyetinin ne kadar fazla dataya sahip olunduğu ile değil, bu bilginin nasıl verimli kullanıldığı ile ilgili olduğuna dikkat çekiyor. O denli ki büyük bilgiyi kullanan şirketler, 50 daha fazla yarar elde ediyor, pazar çalışmalarında 41 tesirli oluyor, reklam harcamaları 37 azalıyor. Uzmanlar, dünyanın yeni ve sonsuz kaynağı olarak son yıllarda toplanan, işlenen ve ticari bedeli olan “büyük veri”nin önümüzdeki yıllarda kıymetinin artacağına dikkat çekiyor.
Üsküdar Üniversitesi Mühendislik ve Tabiat Bilimleri Fakültesi Yazılım Mühendisliği Kısım Lideri, Yapay Zeka ve Akıllı Sistemler Uygulama ve Araştırma Merkezi (YAZAMER) Müdürü Doç. Dr. Türker Tekin Ergüzel, günümüzde pek çok alanda öne çıkan büyük bilgi kavramına ait değerlendirmede bulundu.
Sonsuz ve yenilenebilir kaynak: Veri
Doç. Dr. Türker Tekin Ergüzel, büyük datanın temel olarak toplanan yapılandırılmış yahut yapılandırılmamış bilginin hacimsel büyüklüğünü söz ettiğini kaydederek “Günümüzde birçok alanda toplanan bilginin çözünürlüğünün de artması ile birlikte bu bilgilerin tahlilini yapan sistemler için büyük bilgi sıhhat, finans, eğitim, ticaret alanlarında yaygın kullanılmaktadır. Burada temel olan aslında bilginin hacimsel büyüklüğünden değil bu datanın tahlili sonrasında elde edilen sonuç ve stratejik karar verme öncesi sağladığı öngörü becerisidir” dedi.
Büyük bilgiyi kullanan şirketler daha fazla kazanıyor
Sağlık hizmetlerinin güzelleştirilmesinde büyük bilginin kullanılmasının büyük katkı sağladığını kaydeden Doç. Dr. Türker Tekin Ergüzel, “Veri odaklı tıp, hastalıkların erken teşhisi, tedavi sonucunun öngörülmesi ve biyo-belirteçlerin ortaya çıkarılmasına katkı sağlayacak tahlil tekniklerini kullanmaktadır. Araştırmalara nazaran büyük bilgiyi kullanan şirketler; 50 daha fazla yarar elde etmiş, pazar çalışmalarında 41 tesirli olmuş, reklam harcamaları 37 azalmış ve toplumsal medya kullanımında 37 üzere yüksek oranlarla daha başarılı olmuşlar” diye konuştu.
Büyük datanın üç temel özelliği var
Büyük bilginin temel özelliklerini; yüksek hacim, yüksek sürat ya da fazla çeşitlilik olarak sıralayan Ergüzel, şunları söyledi:
“Bu özelliklere sahip bilginin ham yani işlenmemiş haliyle bir bedeli yoktur. Bu datanın istatistiksel yolları makine öğrenmesi, derin öğrenme üzere bilgi tahlil metotları ile manalandırılması temeldir. “Büyük veri” kavramını klasik “veri” kavramından ayıran temel özellik bilginin daha süratli, daha yüksek çözünürlüklü ve daha yaygın toplanması ve sonrasında da daha süratli fizikî sistemler tarafından yeni bilgi tahlil sistemleri ile işlenmesi ve öngörü modellerinin ortaya çıkarılmasıdır.”
Büyük data kavramının hayatımıza 2000’li yılların başında analistlerin tanımladığı üç temel kavram ile yeni akım tanımlamalarda yaygın kullanıldığını kaydeden Doç. Dr. Türker Tekin Ergüzel, şu bilgileri verdi:
Hacim : İşletmeler; ticari süreçler, akıllı (IoT) aygıtlar, endüstriyel donanımlar, görüntüler, toplumsal medya ve daha fazlası dâhil olmak üzere çeşitli kaynaklardan bilgi toplarlar. Geçmişte, bunu depolamak bu kadar kolay değildi günümüz platformları ile büyük datanın saklanması artık daha kolay.
Hız : Objelerin interneti ve bu alanda kullanılan ve bilgi sağlayan aygıtların yaygınlaşması ile birlikte data transfer suratları da artış göstermiştir. Bu sürat, anlık datanın işlenme hızınında artması sonucunu doğurmuştur.
Çeşitlilik: Datalar, klâsik data tabanlarındaki yapılandırılmış sayısal datalardan yapılandırılmamış metin dokümanlarına, e-postalara, görüntülere, seslere, pay senedi dataları ve finansal süreçlere kadar her tıp biçimde elde edilir. Bu data çeşitliliği üstte sayılan hacim ve sürat ile birlikte değerli datanın seçimini de beraberinde getirmektedir. Bu etapta özellik seçim ve öznitelik azaltma algoritmaları kullanılmaktadır.
Büyük bilginin değeri, verimli kullanımı ile ilgilidir
“Büyük bilginin kıymeti ne kadar fazla bilgiye sahip olunduğu ile değil, bu datanın nasıl verimli kullanıldığı ile ilgilidir” diyen Ergüzel, “Düşük maliyet (1), süratli karar veren sistem (2), yüksek doğruluklu öngörü modelleri ve optimize edilmiş modeller ve (3) akıllı sistemler (4) ile farklı bilgi kaynaklarından toplanan bilgiler önişleme, öznitelik belirleme ve modelleme süreçlerini takiben oluşturulur. Büyük data tahlilinde yaygın olarak derin öğrenme algoritmaları kullanılmaktadır. Bu algoritmalar daha uygun performans için büyük dataya gereksinim duyarlar ve data sayısı arttıkça “tecrübeli” sistemler daha uygun sistem karşılığı üretirler” diye konuştu.
Büyük data nasıl çalışır?
Doç. Dr. Türker Tekin Ergüzel, büyük bilgi tahlilleri öncesi bilginin toplandığı kaynakların standartları, çözünürlükleri üzere özellikleri ile yapılandırılmamış, yarı yapılandırılmış yahut yapılandırılmış bilgileri direktörün beş kıymetli adımı olduğunu kaydetti.
1-Büyük bilgi stratejisi belirlemek
Yüksek seviyede, büyük data stratejisi, veritabanınız içinde ve dışında bilgileri elde etme, depolama, yönetme, paylaşma ve kullanma halinizi denetlemenize ve iyileştirmenize yardımcı olmak için tasarlanmış bir plandır. Büyük data stratejisi, bol ölçüdeki bilgi sürecinde iş başarısı için gerekli yeri belirler. Bir strateji geliştirirken, mevcut – ve gelecekteki – iş ve teknoloji amaçlarını ve teşebbüslerini dikkate almak değerlidir. Bu, büyük datayı yalnızca uygulamaların bir yan eseri olarak değil, başka tüm kıymetli ticari varlıklar üzere ele almayı gerektirir.
2-Büyük datanın kaynaklarını bilmek
Akış dataları, Objelerin İnternetinden (IoT) ve giyilebilir aygıtlar, akıllı otomobiller, tıbbi aygıtlar, endüstriyel ekipmanlar vb. üzere BT sistemlerine akan başka bağlı aygıtlardan elde edilir. Bu büyük dataları elde edildikçe tahlil edebilir, hangi bilgilerin saklanıp saklanmayacağına ve hangilerinin daha fazla tahlil edilmesi gerektiğine karar verebilirsiniz.
Sosyal medya dataları Facebook, YouTube, Instagram vb. üzerindeki etkileşimlerden kaynaklanır. Bu, pazarlama, satış ve takviye fonksiyonları için faydalı olan görseller, görüntüler, ses, metin ve ses biçiminde büyük ölçüdeki büyük bilgiyi içerir. Bu datalar çoklukla yapılandırılmamış yahut yarı yapılandırılmış biçimdedir, bu nedenle tüketim ve tahlil için eşsiz bir zorluk oluşturur.
Halka açık bilgiler, ABD hükümetinin veri.gov, CIA Dünya Gerçekleri Kitabı (CIA World Factbook) yahut Avrupa Birliği Açık Data Portalı üzere büyük ölçülerde açık bilgi kaynaklarından gelir.
Diğer büyük datalar, Bilgi göllerinden, bulut bilgi kaynaklarından, tedarikçilerden ve müşterilerden gelebilir.
3-Verilere erişmek, yönetmek ve depolamak
Modern bilgi süreç sistemleri, çok büyük ölçülerde ve çeşitte büyük datalara süratle erişmek için gereken suratı, gücü ve esnekliği sağlar. Sağlam erişimin yanı sıra, şirketler ayrıyeten bilgileri entegre etmek, bilgi kalitesini, bilgi idaresini ve depolamayı sağlamak ve bilgileri tahlil için hazırlamak emeliyle yollara muhtaçlık duyar. Birtakım datalar kuruluş içinde klâsik bir data ambarında depolanabilir, lakin büyük bilgileri bulut tahlilleri, bilgi gölleri ve Hadoop aracılığıyla depolamak ve işlemek için esnek, düşük maliyetli seçenekler de vardır.
4-Verileri tahlil etmek
Dağıtımlı hesaplama (Grid computing) yahut bellek içi tahlili üzere yüksek performanslı teknolojilerle, kuruluşlar tüm büyük datalarını tahliller için kullanmayı seçebilirler. Öbür bir yaklaşım, tahlil etmeden evvel hangi bilgilerin alakalı olduğunu evvelce belirlemektir. Her iki durumda da büyük data tahlili, şirketlerin datalardan nasıl paha ve öngörü kazandıklarıdır. Büyük bilgi, günümüzün yapay zekâ üzere gelişmiş tahlil teşebbüslerini giderek daha da fazla beslemektedir.
5-Veriye dayalı kararlar almak
İyi yönetilen muteber bilgiler, emniyetli tahlillere ve muteber kararlara yol açar. Rekabetçi kalmak için işletmelerin büyük bilginin tam pahasını anlaması ve bilgiye dayalı bir halde çalışması, içgüdülerden çok büyük datanın sunduğu delillere dayalı kararlar vermesi gerekir. Bilgi odaklı olmanın yararları açıktır. Bilgi odaklı kuruluşlar daha güzel performans gösterir, operasyonel olarak daha öngörülebilir ve daha kârlıdır.
Büyük data, geleceğin mesleklerini belirleyecek
Doç. Dr. Türker Tekin Ergüzel, dünyanın yeni ve sonsuz kaynağı olarak son yıllarda toplanan, işlenen ve ticari kıymeti olan “büyük veri”nin önümüzdeki yıllarda değerinin artacağını belirterek bu alanda yazılım mühendisleri, yapay zeka mühendisleri, bilgi analistleri öne çıkan meslekler olarak dikkat çekeceğini kaydetti.
Kaynak: (BHA) – Beyaz Haber Ajansı