Teknoloji

Verinin Dilini Anlamak

Clive Thompson, wired.com daki yazısında veri analizinin önemine değiniyor ve istatistiğin yeni gramer olduğunu savunan vurucu cümlesiyle metni bitiriyor. Savunduğu fikri son birkaç yılın sıcak başlıklarından olan küresel ısınma konusunu temel alarak anlatmaya çalışması ise, okuyanları bir an için Al Gore’un belgeseline götürüyor; ve kitlelerin veriye hangi ölçek ve detay seviyesinden bakmaları gerektiği konusunu irdeleyerek perdeyi aralıyor.

Thompson’ın satırlarını okurken, işim gereği istemsiz olarak doğal afetlere ilişkin veriler ve halkın bu rakamları nasıl yorumladığı aklıma düştü. “Bu aralar çok deprem oluyor” klişesi ise hemen ardından kulaklarımda çınlamaya başlıyor. Bu tip önermeler, veriye ulaşıp analiz etmeyi tercih etmeyenleri; dünyanın tektonik dengesinin birkaç yıl içinde değiştiği konusunda kolayca ikna edebilir. Halbuki işin renginin farklı olduğunu görmek için kısa dönem ve uzun dönem istatistiklerine bakmak yeterli. Olası iklim değişimi veya doğal afetler gibi olaylarda uzun dönem veri analizini yapmaya çalışmanın birtakım belirsizlikleri beraberinde getirdiğini tahmin edebilirsiniz. Ancak vurgulamak istediğim nokta, detayla ilgilenmeyen ve sadece verileni alanların, süslü rakamlarla kolayca yönlendirilebileceği yönünde. Temel istatistik bilgisi çevresine oturtulmuş analiz alışkanlığına sahip olmayan toplumların, televizyonlarda iyi niyetle, ancak dikkatlice kurulmamış cümleler yüzünden hayatlarının geri kalanı için “bize bir şey olmaz” ya da “bittik” arasındaki tonlamayı kaçırmalarının bir sebebi de anlatanla dinleyen arasındaki köprüyü sağlıklı olarak kuracak matematik dilinin kullanım eksikliği olmalı.

Çok ilgisiz gelebilir, ancak facebook gibi sosyal ağlar ve konum bazlı bilişim servislerinin en büyük değeri ellerinde tuttukları devasa veritabanından kaynaklanıyor. “Beğen” dediğimiz her içerik; birilerinin pazarlama stratejilerini oluşturmak için önemsiz gibi gözüken bir veri noktası haline dönüyor. Tüm önemsiz gibi gözüken noktaları birleştirince ise büyük resmi çoğu zaman görmek mümkün, eldeki sihirli değnek yine veri analizi… İster doğal afet verisi, ister pazarlama; bilginin gücüyle dağılımları kontrol edip yönlendirebilen bireyler mi, yoksa veritabanlarının genişlemesine hizmet eden etkisiz elemanlar mı olacağımıza karar vermede ayrırt edici faktörlerden biri de istatistik…