Analiza Izbora 2018. - osnovne informacije
October 22, 2018
Ovo je bilo par interesantnih sedmica. Prvo su dva prethodna posta s ovog bloga završila na Klixu, potom su infografike koje sam radio na dan izbora, te par dana poslije izbora završile u svim medijima, a moja ćelava glava prvo na N1, pa na Klixu, pa na FTV-u. Sasvim neočekivana, al općenito pozitivna reakcija. Budući da su izbori završeni za ovu godinu, vrijeme je da iste pogledamo.
Na dan izbora mi je javljeno da CIK ima API, tj. programski interfejs koji se može koristiti za skidanje sirovih izbornih podataka. To je mnogo olakšalo samu analizu podataka, mada za izbore od 2014. i ranije treba koristiti druge (sporije) metode, al ovo će svakako biti od velike koristi u sljedećim izbornim ciklusima. Stvar koju sam pomenuo više puta u zadnje dvije sedmice je da je sasvim izvodivo napraviti web sajt koji automatizira analize koje ja radim na ovom blogu, sve što je potrebno je malo brža metoda brojanja glasačkih listića, dakle dok se ne uvedu skeneri to nećemo vidjeti.
Poslije samih izbora se postavilo par pitanja, prvo je da li je bilo izborne krađe? Vjerujem da svi možemo reći da je bilo neregularnosti, ali sama optužba za izbornu krađu je velika stvar, koja zahtjeva konkretne dokaze, ti dokazi se mogu naći na mnoge načine, jedan od tih NIJE broj nevažećih listića. Postoje statističke metode koje se mogu iskoristiti da se takvo nešta utvrdi, a to možete očekivati za dvije sedmice, dok prikupim potrebne podatke za taj tip analize i dok nađem slobodnog vremena da istu izvedem do kraja. Ono što trenutno možemo uraditi je sažvakati rezultate ovogodišnjih izbora. Jedna stvar oko koje se polemika vodila je izlaznost. Mada su ankete u FBiH najavljivale rekordno nisku izlaznost u RS je bila primjetno veća izlaznost, vjerovatno zbog velikog skupa ‘Pravda za Davida’ pred same izbore, to možemo predstaviti na infografici ispod, koja prikazuje razliku između izlaznosti 2014. i 2018.
Kao što možemo vidjeti izlaznost varira po sredinama. Banja Luka i općine oko Banja Luke su izašle u velikim brojevima, dok je Krajina podbacila s izlaznošću, možda zbog masovne migracije iz tog dijela države kako ka inostranstvu tako i ka drugim gradovima unutar BiH. Ako bi gledali korelaciju između broja registrovanih birača i broja glasača očekivali bi linearan trend gdje većina općina varira blizu prosječne izlaznosti od oko 53%. Ispod možete vidjeti grafikon u kojem to testiramo i vidimo visoku korelaciju, s time da Banja Luka znatno odskače od ostalih općina, s većom izlaznosti od očekivane. U jednu ruku se može reći da je ovo očekivano zbog velikih događaja i animacije glasača u tom gradu, ali moguće je da je to rezultat nekih drugih radnji, za koje ću statističke testove praviti u predstojećim sedmicama.
Glasovi za PSBiH prate identičnu korelaciju. Ako bi pak pogledali korelacije za nivoe specifične za entitetske nivoe možemo uočiti neke dodatne detalje. Primjera radi ako pogledamo korelaciju birača i glasača za kantonalni nivo vidimo da Novi Grad Sarajevo odstupa po višoj izlaznosti od ostatka Federacije, dok Sanski Most, Velika Kladuša, Cazin i Bihać padaju ispod regresione linije, tj. odstupaju po niskoj izlaznosti. Grafikon je skoro pa identičan za Parlament FBiH.
Ako bi pak pogledali situaciju u RS, te korelaciju birač vs glasač za NSRS dobijemo sljedeći grafikon gdje vidimo odstupanje Banja Luke od ostatka RS-a, mada manje u odnosu na grafikon za Predsjedništvo. Uzrok ovoga je vjerovatno to što je izlaznost na nivou RS-a viša u odnosu na FBiH, tako da mada Banja Luka ima dosta višu izlaznost u odnosu na ostatak BiH, ona nije toliko viša od prosječne izlaznosti u RS-u.
Nevažeći listići su plijenili pažnju, na infografici ispod možete vidjeti ukupni broj nevažećih listića po općinama. Dugmićima ispod mape možete promjeniti nivo za koji posmatrate nevažeće listiće.
Razliku sa procentualnim vrijednostima za predsjedništvo možete uporediti sami odlaskom za ovaj link. Tokom posmatranja ove mape imajte na umu da se u većim općinama i očekuje viši broj nevažećih, ipak sam se potrudio da obojim mapu na takav način da je intenzitet crvene boje vezan za sami broj nevažećih, tu vidimo da Banja Luka (5000 nevažećih) daleko odskače drugim općinama, Zenica, Velika Kladuša, Zvornik i Bijeljina je prate sa visokim brojom nevažećih listića, tu treba svakako dodati i Novi Grad Sarajevo sa 3675 (5.9%) nevažećih listića. Brčko je crno jer ga nisam uključio u ukupnu statistiku.
Rezultate (preliminarne sa oko 84% prebrojanih listića) za predsjedništvo ste već mogli vidjeti na ovom sajtu, ali ta karta može dati pogrešan dojam jer se vide velike regije koje su otišle većinom za jednog ili drugog kandidata tako skrivajući stvarne rezultate izbora koji nam govore da je bila tjesna borba u mnogim općinama. Ako bi stavili na kartu BiH po jednu tačku za svakih 100 glasova za nekog kandidata dobili bi sljedeću kartu. U višoj rezoluciji dostupna ovdje.
Tu vidimo ne samo rasprostranjenost glasova već i gustinu naseljenosti BiH. Brdoviti predjeli zemlje, mada zauzimaju veliku površinu nose jako sitan broj glasova. Isti tip mape sam napravio još i za Parlamentarnu Skupština BiH, u višoj rezoluciji dostupna ovdje, kao što vidite nisam koristio iste boje, jer sam shvatio koliko ovaj tip karte nema smisla za nas, al lijepo prikazuje koliko je komplikovana Bosanska politka. Imamo 15 većih stranaka koje konkurišu za najviše pozicije u državi, neke od kojih čak i dobijaju glasove. Bila je ideja i da ofarbam stranke po ideološkoj pripadnosti, ali nisam dovoljno stručan, a ni dovoljno besposlen da listam programe istih i određujem im poziciju po nekim skalama.
Jedna stvar koja mi je predložena je da provjerim korelaciju između broja birača i broja glasova koji su stranke dobile. Ovim bi mogli provjeriti kome ide na ruku viša izlaznost, ali zbog teritorijalnosti BiH stranaka to je teška stvar za izvesti. Na šta mislim? Pa, imamo 145 općina u državi. Većina stranaka nije prisutna ni u pola tih općina, neke su aktivne samo u par gradova, tako da to remeti računanje korelacije. Tu bi dakle trebao da uradim malo detaljniju analizu, gdje bi izbacivao općine u kojim su neke stranke neaktivne, a to je već tema za neki drugi blog post.
Šta dalje? Pa s ovim sam htio da dam zaključak na analizu rezultata izbora, CIK će uskoro objaviti potvrđene rezultate, znati će se zvanično ko je ušao u vlast a ko nije, mada je i u ovom trenutku jasna raspodjela mandata. Ja svoju energiju planiram usmjeriti ka testiranju lokacija gdje se sumnja na izbornu krađu. Jedini tip izborne krađe koji znam da je moguće provjeriti je takozvani ‘ballot stuffing’, gdje se već popunjeni birački listići ubacuju u kutije, bez znanja posmatrača, recimo kad bi neko imao pristup višku biračkih listića (ili firmi koja štampa iste…), pa slao ljude da ubace te unaprijed popunjene listiće skupa sa svojim glasovima, to bi poremetilo očekivanu distribuciju glasova po biračkim mjestima, te postoji već godinama metoda s kojom se takve stvari daju ispitati. Dakle to je tema za sljedeće javljanje, koje možete očekivati kroz 2 sedmice.
Sirove podatke sa rezultatima glasanja u obliku tabela, JSON fajlova itd planiram objaviti na GitHub, to će na žalost iziskivati vremena, kojeg trenutno nemam, kad bude biće blog post i mala promocija po društvenim mrežama.
Sve komentare, sugestije i tako dalje možete ostaviti dolje u komentarima, te me upratiti ako se dodate na mailing listu. Za sve ostale kontakte se javite na Twitter ili LinkedIn.