HABER MERKEZİ
Veri bilimi, temel olarak ham olan veriden anlamlı bilginin elde edilmesidir. Bunun için istatistik biliminden, kamuya açık verilerden, sosyal medyadan yoğun olarak yararlanılıyor. Mevcut veriyi anlamlı hale getirmek için gürültülü veri dediğimiz ham veri uç değerlerden temizlenerek anlamlı hale getiriliyor. Veri bilimi çalışmalarının yüzde 85 yüzde 90’ı bu anlamlandırma ve veriyi temizleme (data cleaning) işlemi oluşturuyor. Veri biliminde kullanılan bilimsel yöntem ve araçlar gün geçtikçe gelişiyor. Bu gelişmeler ile birlikte veri madencileri olarak adlandırılan veri analistleri, toplumsal birtakım sorunları, gerçekleri veri ile gün yüzüne çıkarıyor. İktidar, veri gazeteciliğinin gelişmesi ile birlikte gerçekleri ne kadar gizlemeye çalışsa da gerçekler verilerle ortaya çıkıyor. AKP, son dönemde rahat hareket edemedikleri için veriyi sansürleme yoluna gitti. Bunun en büyük örneği TUİK’ten 2014-2017 yılları arasında çocuğa yönelik cinsel istismar verilerini kaldırmasıdır. Ayrıca TUİK’in her ay yayınladığı enflasyon verileri toplum tarafından inandırıcılığını kaybetti. Veri analisti Onur Mat, Yeni Yaşam Gazetesine son zamanda veriye uygulanan sansürü anlattı.
‘Sosyolojik çalışmamızı sağlıyor’
Veri bilimini verilerden bir anlam oluşturma olarak tanımlayan veri analisti Onur Mat, “Tek bir veri bizim için anlam ifade etmeyebilir fakat birçok veri, nokta kümelerini birleştirince elde bir nokta kümesi oluşuyor. Bu noktaları birleştirerek anlam çıkarabiliyoruz. Veri dediğimiz şey örneğin, dünyanın bir yerindeki sıcaklığı olsun. O yere ait binlerce sıcaklık verisi olduğu zaman bunları birleştirip son 20 senede sıcaklık ne kadar artıp azaldığını gözlemleyebiliyoruz. Veri analizinde kullanılan yöntem ve araçların bilimsel olarak doğrulanmış olması gerekiyor. Veri ile geçmişte ne olduğunu anlamaya, gelecekte ise ne olacağını tahmin etmeye çalışıyoruz. Veri bizim sosyolojik olarak çalışmamızı sağlıyor” dedi.
‘Kutuplaşma var’
Mat, sosyal medyanın aktif kullanılmaya başlamasıyla birlikte sosyal medyanın veri analistleri için önemli bir veri kaynağı sağladığını söyledi. Sosyal medyanın sağladığı büyük verinin, kamuoyu araştırmalarına yeni bir boyut kattığını belirten Onur Mat, “Sosyal ağ analizi, takip ilişkileri ve içerik etkileşimlerine dayalı ilişkiler ağının, istatistiksel yöntemlerle incelenmesidir. Sosyal ağ analizi, çeşitli yakınlıkların, eğilimlerin belirlenmesi çalışmasına da deniyor. Bize toplulukları keşfetme ve anlama imkanı sunuyor. Sosyal medya ağ analizi, halen çok yeni ve tamamlayıcı nitelikte bir yöntem. On binlerce yüz binlerce veriyi üst üste koyduğunda başka birtakım patenler ve örüntüler ortaya çıkıyor. Bu patenler de toplumsal olarak bizlere bir şey anlatıyor. Elde ettiğimiz örüntüler ile toplumsal hareketler belirlenebiliyor. Analiz ile zaman içinde toplumsal hareketliliğin nasıl değiştiğini, gündemlere verilen tepkileri ve bu tepkilerin nasıl değiştiğini okumak ve anlatmak mümkün. Büyük veri (Big Data) ile toplumdaki kutuplaşmayı da okuyabileceğin bir durum yakalayabiliyorsun” diye konuştu.
‘Veriler sansürleniyor’
Veri analisti Onur Mat, iktidarın veriyi sansürleyerek, gizleyerek, gerçekleri toplumdan gizlemeye çalıştıklarını vurguladı. Mat, “İktidar, bazen veriye erişimimizi zor ya da imkansız hale getirebiliyor. Verilerde bir tutarlılık olması gerekiyor. Araştırma yaparken veride tutarlılık olmadığını görüyorsun. Her gün yayınlanan bir şeyin bir gün yayınlanmadığını düşün. Veriyi göremesek bile burada bir eksik var, veri kaybedilmiş diyebiliyoruz. İktidar, veri ile birlikte artık eskisi kadar rahat hareket edemiyor. Ne kadar bilgiyi kaybetseler de internetin bir yerinde izi veya gölgesi kalmış oluyor. ‘Haberim yoktu’ deseler de, işlerine geldiği gibi bol keseden atsalar da ummadıkları bir yerden gizlenen gerçek ortaya çıkıyor. Verinin kaybedilmemesi için iyi bir arşivcilik gerekiyor” diye belirtti.
Muhalefete alan açıyor
Türkiye’deki politik alanın giderek daraldığına dikkat çeken Onur Mat, “Veri iyi kullanıldığında muhalefete nefes alacak güçlü bir araç sağlıyor. Veri niceliksel olduğu için yalanlamaya çok fazla açık değil. Kamusal veri yalanlanamadığı için araştırmalarımıza güçlü bir zemin ve argüman oluşturuyor. Örneğin, kamuya açık veri ile bütçenin nelere harcandığını hesaplayabiliyorsun. Eğitime, sağlığa harcanması gereken paranın yandaşı zengin etmeye, diyanete, imam hatipe harcandığını veri ile ortaya koyabiliyorsun. Toplumun öncelikli ihtiyacı bu muydu? diyebiliyorsun. Kamu ihalelerinde ‘Afet riski vardı. İhaleyi bu şirkete verdik’ deseler de veri ile ihalelerin en çok Cengiz ve Limak Holding’e verildiğini, o bölgede afet riski olmadığını ortaya koyabiliyoruz” dedi.