Görüş: 2014 Yerel Seçimleri Erken Sonuçları İçinde Veri Madenciliği ve İstatistik

Emrah Temizkan ile BirGün Gazetesi için gerçekleştirdiğim söyleşi.

***

Öncelikle sizin grafikleriniz ne analtıyor? Nasıl okumalı?

Hazırladığım grafikler iki hipotezi test ediyor. Bunlardan ilki Ankara’da katılımın çok yüksek olduğu sandıklardan AKP’ye çıkan oy oranının CHP’ye çıkan oy oranından daha fazla olduğu iddiası. İkincisi ise bir sandıkta AKP’ye verilmiş oyların CHP’ye verilmiş oylara oranı arttıkça, sandıktan çıkan geçersiz oyların sayısının da artıyor olduğu iddiası. Ankara’nın seçim verileri incelendiğinde, verilerin bu iki iddiayı da desteklediği görülüyor.

Bu iddiaları farklı açılardan değerlendiren birçok kişi oldu. Eren Yanık (@erenyanik), Erik Meyersson (@emeyersson), Hüseyin Demir (@husdemir) ve Arpat Özgül (@arpatoz) bu kişilerden bazıları, ve benim bulgularım bu araştırmacıların bulguları ile paralellik gösteriyor.

***

Hazırladığım ilk grafik şöyle:

2014-yerel-secim-01

Bu grafikteki her siyah nokta bir sandığı ifade ediyor. Sandıkların grafik üzerindeki dağılımını belirleyen ise herhangi bir sandıktan AKP ve CHP’ye çıkan oyların birbirine oranı. Eğer bir sandıktan AKP ve CHP’ye eşit miktarda oy çıkmışsa, o sandığı ifade eden sandığın grafik üzerindeki yeşil diagonal çizgi üzerine düşmesini bekliyoruz. Bu bağlamda yeşil çizginin altında kalanlar sandıklar AKP’nin, üstünde kalan sandıklar ise CHP’nin bir diğerine üstünük sağladığı sandıkları ifade ediyor. Katılımın %99′un üzerinde olduğu sandıklar da ayrıca kırmızı bir nokta ile işaretli. Görüldüğü gibi bu sandıklardan çoğunlukla AKP tarafında. Bu “Ankara’da katılımın çok yüksek olduğu sandıklardan AKP’ye çıkan oy oranının CHP’ye çıkan oy oranından daha fazla olduğu” iddiasının görsel sunumu.

İkinci grafik de şöyle:

2014-yerel-secim-02

İki panelden oluşan bu grafikteki noktaların dağılımını belirleyen faktörler önceki grafik ile aynı. Fakat bu sefer her bir nokta sandığın geldiği ilçeye göre renklendirilmiş durumda. İlçelerin oy oranlarındaki beklenen farklılıkların oluşturduğu kümeleri görmek mümkün. İkinci panlede farklı olarak her sandık, içinden çıkan geçersiz oyların sandıktan çıkan tüm oylara olan oranına göre normalleştirilmiş durumda. Yani, eğer bir sandıktan çıkan geçersiz oy oranı çok ise bu sandık sandık daha görünür, az ise daha az görünür bir şekilde ifade ediliyor. Bu normalleştirmeyi takiben grafiğin CHP’nin üstünlüğünü ifade eden kısmında yer alan sandıkların neredeyse tamamen kaybolduğunu görüyoruz. AKP’nin üstünlüğünü ifade eden kısımda ise geçersiz oy sayılarının yarattığı bir kalabalık var. Bu da “bir sandıkta AKP’ye verilmiş oyların CHP’ye verilmiş oylara oranı arttıkça, sandıktan çıkan geçersiz oyların sayısının da artıyor olduğu” iddiasının görsel sunumu.

***

Grafiklerinizin ışığında AKP’nin sonuçları manipüle ettiğini okuyabilir miyiz?

Seçim sonuçlarının halk iradesini tam anlamı ile yansıtmadığı, yakılmış ve çöplerden toplanan oy pusulaları, doğru şekilde kayda geçirilmemiş tutanaklar, 40 ilde yaşanan elektrik kesintileri, ve müşahitlerin çektikleri kamera görüntüleri ile sabit. Fakat salt sandık verilerine odaklanarak, ham veri üzerinden bu soruya yanıt arayacaksak, bence eldeki veri seçim sonuçlarının manipüle edildiğine zayıf da olsa bir destek veriyor. Fakat bu manipülasyonun AKP tarafından yapılmış olabileceğine dair net bir sonuç çıkarmak bence mümkün değil.

Örneğin ilk iddiayı, yani “Ankara’da katılımın çok yüksek olduğu sandıklardan AKP’ye çıkan oy oranının CHP’ye çıkan oy oranından daha fazla olduğu” iddiasını ele alalım. Grafiğe baktığınızda gördüğünüz kırmızı noktalı sandıkların sayısı tüm sandıkların çok büyük bir kısmı seçmen sayısının çok düşük olduğu sandıkları işaret ediyor geliyor. Hem İstanbul hem de Ankara sandıklarını analiz ettiğimde, seçmen sayısı düştükçe kullanılan oy sayısının arttığını ve bunun istatistiksel olarak anlamlı bir trend olduğunu gördüm. Dolayısıyla seçmen sayısının az olduğu yerlerde katılımın yüksek olması şaşırtıcı değil. Seçmen sayısının az olduğu yerlerde AKP’nin daha fazla oy almasının nedeninin ne olduğuna ise Türkiye’deki siyasi konjonktür içinde yanıt arayabiliriz. Üstüne üstlük bu sandıklardan CHP’ye de oy çıkmış, dahası bu durumda olan 134 sandığın %16′sında CHP AKP’den daha fazla oy almış. İlk iddianın bir şaibenin neticesi olma ihtimalini azaltan tüm bu noktalar bir kenara, İstanbul’da katılımın çok yüksek olduğu sandıklara baktığımda Ankara’da AKP tarafında görünen trendin İstanbul’da CHP tarafına kaydığını görüyorum:

2014-yerel-secim-03

Bu da benim için katılım oranı yüksek sandıklara ilişkin şaibe iddiasını ispatlanamaz kılıyor.

Bir de ikinci iddiayı, yani “bir sandıkta AKP’ye verilmiş oyların CHP’ye verilmiş oylara oranı arttıkça, sandıktan çıkan geçersiz oyların sayısının da artıyor olduğu” iddiası. Bu da ilk iddiaya benzer şekilde görselleştirildiğinde açıkça görünen bir iddia:

2014-yerel-secim-04

Grafikte gördüğünüz şey tam olarak ikinci iddiayı destekler bir görüntü. CHP’nin önde olduğu sandıklar, yani grafiğin üst kısmında kalan noktalar, sandıklardan çıkan geçersiz oylar hesaba katıldığında neredeyse tamamen yok oluyor. Fakat bir veri içerisinde rastlanan trend birden fazla şekilde açıklanabilir. Örneğin buna bakıp “AKP’nin kazandığı sandıklarda CHP’nin oyları geçersiz sayılmış” denilebilir. Bununla beraber bu grafiği Facebook’ta yayınladığımda ABD’nin Florida eyaletinde yaşayan Dr. Hüseyin Demir, geçersiz oy oranı ile eğitim seviyesi arasında bir trend olabileceğini ortaya attı. Dr. Demir’in TÜİK verilerini kullanarak oluşturduğu ilçe eğitim endeksi ışığında Ankara sandıklarına yeniden baktığımızda, eğitim seviyesi ile bir önceki grafikte gözlemlenen trendin birbirine çok benzer olduğunu görüyoruz:

2014-yerel-secim-05

Yani bir sandıktan çıkan geçersiz oy oranı ile bu sandığın yer aldığı ilçenin ortalama eğitim seviyesi arasında negatif bir ilişki var. Eğitim seviyesinin yüksek olduğu yerler dışında CHP’nin neden başarılı olamadığı sorusu elbette başka bir mecralarda yanıt aranması gereken bir mevzu. İstanbul’da da partilerin aldıkları oy oranları ve geçersiz oylar arasında bir trend olup olmadığına baktığımızda, aldığı oy oranı arttıkça geçersiz oy oranlarındaki azalışın istatistiksel olarak anlamlı olduğu tek partinin CHP olduğu görülüyor:

2014-yerel-secim-06

Bence bu birçok siyasi analistin ilgisini çekecek enteresan bir durum. Bana göre CHP ile her parti arasında görülen bu trendden yola çıkarak Ankara’daki AKP oylarında şaibe var demek isteyen birisinin çok daha fazla delile ihtiyacı var

Zürih Üniversitesi’nde Asistan Profesör olarak faaliyet gösteren Dr. Arpat Özgül’e göre geçersiz oyların oranının sadece eğitim düzeyiyle açıklanamayacağını gösteren bir diğer ipucu var. Bu bağlamda kendisi bir yolsuzluk olduğu iddiasına benden daha sıcak bakıyor. Dr. Özgül’ün hazırladığı aşağıdaki grafik Istanbul ve Ankara’da AKP ve CHP’nin ilk iki sırada olduğu sandıklardaki geçersiz oy oranlarını gösteriyor:

2014-yerel-secim-07

İki panelden oluşan bu grafiğin Ankara’yı ifade eden kısmında her sandığı temsil eden renk sandığın bağlı olduğu ilçenin eğitim düzeyini, dairenin boyu da sandıktaki toplam oy sayısını gösteriyor. Eğer geçersiz oy oranını sadece eğitim düzeyi belirleseydi bu grafiğin sağına doğru düzenli bir artış görmemiz gerekirdi. Aksine, her iki şehirde de geçersiz oy oranının en fazla olduğu yerler iki partinin başbaşa olduğu, özellikle AKP’nin CHP’nin biraz önünde olduğu sandıklar.

Çekişmenin olduğu bölgelerde sandık başındaki görevlilerin oy geçerliliği konusunda daha titiz ve tavizsiz olması söz konusu olabilir. Oy oranlarındaki farkın azaldığı yerlerde geçersiz oy oranlarındaki artışı bununla açıklamak mümkün olabilecek olsa da, Dr. Özgül bu artışın her iki şehirde de AKP tarafında yoğunlaşması ve istatistiksel olarak anomali niteliğinde (yüzde otuza varan) sıçramalar göstermesini endişe verici buluyor.

Muhakkak kesin bir yargı için bu “enteresan” sandıklardaki geçersiz oyların içeriğine bakılmalı.

Eğer görüşümüz bu tip bir yeniden incelemeye yardımcı olacak ise, Dr. Özgül ile ortak önerimiz, bu sandıklardan en enteresan iki tanesinin, Ankara’nın Keçiören ilçesindeki 3193 numaralı sandık, ve Yenimahalle ilçesindeki 1436 numaralı sandıktan çıkan geçersiz oyların yeniden incelenmesi yönünde.

***

Geçersiz oy sayısı epey fazla gözüküyor. Oyların nasıl geçersiz sayıldığı hakkında bir fikriniz var mı? Geçersiz oylar seçimi nasıl etkiledi?

Evet, geçersiz oy sayısı gerçekten çok fazla. Yerel seçimlerde birden fazla oy pusulası ve zarf olduğu için insanların karıştırma ihtimali artıyor. Misal, Ankara’da 124,075 geçersiz oy söz konusu. Bu Ankara’daki oyların %3.7′si. Bunlardan 82,647 tanesi AKP’nin CHP’den daha çok oy aldığı sandıklarda çıkmış. Bu rakam geçersiz oyların %66.8′ı. İstanbul’daki geçersiz oyların oranı daha da fazla: kullanılan oyların %4.3′ü geçersiz sayılmış. Toplam 387,444 oy. Bunlardan 276,809 tanesi AKP’nin CHP’den daha çok oy aldığı sandıklarda çıkmış ve geçersiz oyların %71.4′ünü teşkil ediyor; Ankara’dakine yakın bir oran. Bir oyun nasıl geçersiz sayıldığını yukarıdaki tartışmaların döndüğü Facebook gönderisi altında sordum ve sandık başında görev yapan kişilerden çeşitli yanıtlar geldi. Örneğin muhtarlık ve belediye başkanlığı için işaretlenen oy pusulalarını aynı zarfa koymak, mührü karenin dışına basmak, ya da mührü pusulaya birden fazla sefer basmaktan, mührü doğru yere basıp sonra beğenmediği partinin üstüne çarpı atmaya bir oyun geçersiz olmasına sebep olan birçok pratik olduğunu öğrendim. Okuma yazma bilmeyen birisinin bu konularda ne kadar bocalayabileceğini hayal etmek güç değil.

Eğer eğitim seviyesi ile geçersiz oy verme ihtimali arasında çok sıkı bir ilişki varsa, geçersiz oyların seçime olan etkisi, toplumun eğitim seviyesi düşük kesimine hitap eden partileri dezavantajlı duruma sokan bir etki olması beklenirdi. Şaibe iddiaları bunun bu yönde olmadığı yönünde. Bence yapılacak en isabetli test bir ilçe seçilip geçersiz oy pusulalarının yeniden değerlendirilmesi.

Eğitim düzeyinin oy verilen partiyle ilişkisinden söz edebilir miyiz?

Ankara’daki sandıklardan yola çıkarak böyle bir ilişkiden söz etmemiz mümkün görünüyor. TÜİK verilerine göre ortalama eğitim düzeyinin düşük olduğu ilçelerde AKP CHP’ye büyük üstünlük sağlamış, benzer şekilde ortalama eğitim seviyesinin yüksek olduğu ilçelerde de CHP’nin AKP’ye üstünlüğü söz konusu. Bunun diğer illlerde de benzer trendler takip edeceğini tahmin ediyorum. Bu elbette çok hassas bir konu. Dr. Hüseyin Demir’in bu mevzuyu gündeme getirişinin ya da benim bu verileri kendi analizlerime dahil edişimin ardındaki amaç herhangi bir partiyi, seçmeninin ortalama eğitim seviyesine göre yermek ya da yüceltmek değil, bilakis şaibe olarak değerlendirilebilecek bir trendi başka bir perspektif kullanarak aydınlatma amacı idi. Bir KONDA araştırmasına göre AKP ve CHP’nin 2011 seçiminde üniversitelilerden aldığı oy sayısı birbirinden çok da farklı değil. Fakat görünen o ki AKP, toplumun eğitim olanaklarından yeterince faydalanamamış kesimlerine ulaşmayı daha çok başarıyor. Ya da bir diğer deyişle, MHP ve HDP’yi de resme dahil edersek, İstanbul verilerinden yola çıkarak bu kesime ulaşamayan tek partinin CHP olduğunu iddia etmek de mümkün.

***

Erik Meyersson makalesinde ”Küçük sandıklara AKP pusulaları yığmaktan daha etkili bir manipülsayon yöntemi her sandıktan CHP oylarını geçersiz saymak olabilir” diyor. Siz nasıl değerlndiriyorsunuz?

Bu seçim Türkiye’de ilk kez ham seçim verileri üzerinden çok geniş çaplı analizlerin yapıldığı bir seçim oldu. Bilim insanlarının bu verilere ilgi göstermesini Türkiye adına çok sağlıklı bir gelişme olarak görüyorum. Dr. Meyersson’un ortaya attığı hipotez de makul ve geçerliliği test edilmesi gereken bir iddia. Bu iddiaların ve karşıt görüşlerin çeşitliliği bilimin doğasına ve ilerleyişine çok uygun, fakat bu görüşleri alıp toplumun anlayabileceği bir dile çevrirken çok temkinli olmak gerekiyor. Ben teorik olarak bu yöntemin kullanılabilir bir manipülasyon olduğu noktasında Dr. Meyersson ile aynı fikirde olsam da, verinin bunu ispatlar nitelikte bir trend ortaya koyduğu noktasında kuşkuluyum. Zira eğer manipülasyon varsa bu manipülasyonu CHP’nin mi yoksa AKP’nin mi yaptığını tespit etmek güç. “AKP önde olduğu yerlerde CHP’nin oylarını geçersiz saydı” demekle “CHP geride kaldığı yerlerde AKP oylarını geçersiz saydı” iddiaları arasında istatistiksel olarak hiçbir fark yok. İstatistik analizler bize “sıradışılıkları” göstermekte çok etkin, fakat bu iddiaların ardındaki hikaye ancak oy pusulalarını tek tek alıp yeniden değerlendirmekle ortaya çıkabilir. Atılacak en isabetli adım bir partinin sandık görevlileri ya da müşahitlerini suçlama yerine bu veriler ışığında seçilecek bir ilçedeki geçersiz oy pusulalarının çok partili bir organizasyon ile yeniden değerlendirilmesi.

***

Usulsüzlük iddiaları çok güçlü değil araştırmanızda anlattığınız kadarıyla. En doğru şekilde neye inanmalı?

Dr. Arpat Özgül’ün örneklediği gibi yeniden değerlendirmeye değer sıradışılıklar da mevcut, bununla beraber ben ham sandık verilerinden yola çıkılarak ortaya atılan usulsüzlük iddialarının genel anlamda çok güçlü olmadığını düşünüyorum. Fakat . Fakat başta da dediğim gibi bu seçimlerde çok ciddi usulsüzlüklerin yapıldığı bir gerçek. Çöplerden çıkan oy pusulalarının, yanmış oy pusulalarının, ve elektrik kesintilerinin hesabı sonuna kadar sorulmalı.

Bence bu Türkiye için harika bir pratik idi. Twitter’da muazzam bir bilgi alışverişi oldu. Dünyanın dört bir tarafına dağılmış olan yerli yabancı bilim insanları bilgi alışverişinde bulundu ve karmaşık veriler içinden anlamlı trendleri herkesin anlayabileceği şekilde ortaya çıkardı. Twitter’ın seçim sonuçlarının çok ciddi şekilde analiz edildiği günlerden kısa bir süre önce kapanmış olması, seçimlerin çok kısa bir süre sonrasında ise yeniden açılması gerçekten çok manidar.

Sandık başında olmak, müşahit olarak gönüllü olmak, her olan biteni kayıt altına almak ve olabilecek hataları orada çözmek çok önemli. Sonraki adımda ise verileri herkesin erişebileceği şekilde İnternet ortamına aktarmak çok kritik. Seçimlerin üzerinden günler geçmiş olmasına rağmen YSK’nın sonuç sayfasına erişmek mümkün değil. Medya kuruluşları ile paylaşılan verilerin halk ile paylaşılmamasının ardında nasıl bir gerekçe olduğunu gerçekten çok merak ediyorum. Tüm bunlar genel seçimler için çok daha iyi organize olmamız gerektiğini gösteriyor.

Parti ilişkilerinden bağımsız şekilde bu analizleri yapan insanların oluşturduğu insiyatifin seçimlerde organize bir şekilde yolsuzluk yapmaya niyetlenebilecek gruplara verdiği mesaj çok açık. Dışarıda ham seçim verisi ile beslendikleri durumda verinin içine dalıp tüm soru işaretlerini çıkarmaya ve seçim sandıklarının halkın iradesini yansıtıp yansıtmadığının dijital bekçiliğini yapmaya gönüllü birçok insan var. Genel seçimlerde bu analizlerin çok daha önemli bir rol oynayacağına inanıyor, bu konuların peşini bırakmayan, vakit ayırıp bu verileri halk adına analiz eden tüm bağımsız araştırmacılara teşekkür ediyorum.