Monday, December 14, 2009

Marje si aproximari (RO)

La turul doi al alegerilor prezidentiale, pe 6 decembrie, s-au prezentat la vot 10,6 milioane de alegatori.
Numarul voturilor nule a fost de 138.476, din care 863 de voturi nule la sectiile din strainatate. Asta inseamna ca pe teritoriul Romaniei au fost inregistrate 137.613 voturi nule.
Curtea Constitutionala a cerut vinerea trecuta renumararea voturilor nule de catre BEC.

Dupa renumararea celor 137.613 voturi nule din tara, BEC a re-validat 2.137 de voturi in total (1.169 pentru Basescu, 968 pentru Geoana). Asta inseamna ca la prima strigare numararea voturilor nule a generat o eroare de peste 1,5% (2.137 din 137.613). Vorbim de numarare (1, 2, 3, 4...), nu de estimari sau calcule complicate.

Asta, in conditiile in care diferenta dintre candidati conform rezultatelor finale este de 0,66% (50,33% Basescu, 49,67% Geoana).

Deci:
- eroare la numarare: peste 1,5% (ce-i drept, pe un esantion mic reprezentat de voturile nule)

- marja victoriei: 0,66% (din totalul voturilor valabile).

Probleme?

Cine crede ca Curtea Constitutionala va cere renumararea tuturor voturilor?

UPDATE: Au fost re-numarate si voturile nule din strainatate. S-au validat in total 109 voturi, ceea ce inseamna 12% (!!!), adica 109 din 863. Rationamentul de mai sus ramane valabil.
Pana acum cifrele nu par a indica fraude, dar in mod clar indica o neglijenta cu mult peste limita tolerabila si care potential - la scara celor 10,6 milioane de voturi exprimate - ar fi putut influenta rezultatul alegerilor.

UPDATE 2: Curtea Constitutionala s-a pronuntat, respingand contestatia PSD fata de al doilea tur al alegerilor prezidentiale. As dori sa continuu discutia de mai jos din pura dorinta de a intelege chestiunea 'erorilor' de numarare, dar nu ca o modalitate de a prelungi paranoia fraudarii alegerilor. In aceasta privinta, ramane valabil ce am scris ieri: daca are onoare, Geoana ar trebui sa se tina de cuvant si sa recunoasca rezultatul conform deciziei CCR.

UPDATE 3: Geoana s-a tinut de cuvant, pana la urma.

UPDATE 4: In sfarsit, mi-a "picat fisa" si am inteles unde e problema cu rationamentul de mai sus. Cu scuzele de rigoare, as vrea totusi sa dau explicatia aparentului paradox statistic.
Iata intai cum am judecat initial: sunt trei categorii de voturi - Basescu, Geoana, Nule. Orice vot exprimat intra obligatoriu in una - si numai una - din aceste categorii. Daca la determinarea numarului de voturi Nule a existat o eroare de 1,55%, de unde stim ca la celelalte doua categorii (Geoana, Basescu) nu exista erori similare? Nu cumva statistica sugereaza ca ar putea exista erori similare, caz in care s-ar putea pune in discutie rezultatul alegerilor (daca eroarea posibila e de ordinul 1,5% la voturile pentru Basescu sau Geoana, atunci diferenta dintre ei, de 0,66%, ar fi in interiorul marjei de eroare)?
Nu, gresit, statistica nu spune asta, si iata de ce.
Tipul de erori de care vorbim nu sunt erori de numarare, ci de identificare a voturilor (adica de plasare a lor intr-una dintre cele trei categorii - B, G, N). Totalul nu se poate schimba, exista acea "cheie" a proceselor verbale pe sectii, care consta in niste sume de control (adica toate voturile trebuie sa iasa la numar, B+G+N = numarul total de voturi exprimate; care la randul sau coincide cu nr. de buletine de vot folosite s.a.m.d.). Asta inseamna ca orice vot gresit identificat creeaza o eroare egala in numar absolut in doua categorii: -1 in categoria in care ar fi trebuit sa fie, dar nu este; si +1 in categoria in care este, dar nu ar fi trebuit sa fie. Deci, in numar absolut, erorile sunt obligatoriu comparabile / apropiate pentru toate categoriile. Dar daca ele sunt de acelasi ordin de marime in numar absolut, ca proportie pot fi foarte diferite, in functie de marimea categoriei. Deci, statistic, faptul ca avem o eroare procentual mare intr-o categorie mica (N) nu implica statistic o eroare procentual comparabila intr-o categorie mare (B,G), ci procentual mult mai mica (pentru ca este comparabila ca numar absolut).
Nu stiu cat e de inteligibila explicatia de mai sus, dar pe scurt inseamna ca relevant nu e procentul de eroare la o anumita categorie (de ex. N, a voturilor nule), ci numarul absolut al cazurilor de eroare, adica 2.000 si ceva. Care procentual inseamna foarte, foarte putin la scara categoriilor mari (B,G).

Toata discutia de mai sus nu are nici o legatura cu eventuale fraude, ci doar cu statistica erorilor.

5 comments:

  1. Cred ca totusi faci o greseala. Trebuie sa compari diferenta rezultata in urma renumararii (adica (1169-968)/138.476), cu diferenta rezultata in urma alegerilor. Adica sa compari intre ele diferentele rezultate intre cei doi candidati, nu diferenta nule/valabile cu diferenta Basescu/Geoana, acestea din urma reprezentand doua valori cu semnificatie statistica diferita. Eroarea de numarare (cea de 1.5% de care vorbesti) poti sa o extrapolezi, daca vrei, la totalul voturilor exprimate, dar nu la diferenta intre candidati.

    ReplyDelete
  2. Inteleg punctul de vedere, poate nu m-am exprimat eu foarte bine. Dar hai sa facem urmatorul experiment mental: sa presupunem ca "voturi nule" ar reprezenta voturi pentru un al treilea candidat, Bugs Bunny (nu e chiar gluma, uite aici: http://turambarr.blogspot.com/2009/12/salvatorul-natiunii.html). Rezulta ca avem o eroare de numarare de peste 1,5% pentru acest "candidat" (atentie, mai mare decat eroarea admisibila a unui exit poll obisnuit!!). Deci pot presupune ca este posibila o marja de eroare similara si la numararea voturilor pentru ceilalti doi candidati, Basescu si Geoana. Daca marja de eroare de numarare pentru fiecare dintre ei este in jur de 1,5% (poate fi mai mult de fapt, ce vedem noi este ca eroarea actuala de numarare este de peste 1,5%), nu cumva inseamna ca o diferenta mai mica de 3% (marja de eroare x 2) intre ei ridica semne de intrebare?

    ReplyDelete
  3. Nu, ma tem ca nu tine...astea sunt speculatii, dar in matematica nu e loc de asa ceva. Daca tu presupui ca 1.5% din voturile nule sunt valabile si se duc la Bugs Bunny, atunci nu mai ai ce sa extrapolezi la ceilalti candidati. Toata eroarea se duce la Bugs Bunny, intelegi?

    ReplyDelete
  4. Hm...
    Eu vad lucrurile asa: sunt trei categorii de voturi: i) Basescu; ii) Geoana; iii) voturi nule. Au fost numarate si fiecare categorie a primit un numar de voturi.
    Pana acum, doar ultima categorie a trecut printr-o renumarare, care a scos la iveala o eroare de peste 1,5% la prima numarare.
    De ce nu ar fi rezonabil sa presupun ca o eroare similara se va fi putut produce si la primele doua categorii?
    As fi curios sa aud si alte puncte de vedere.

    ReplyDelete
  5. Sa fac o clarificare: eu personal NU cred ca o renumarare ar schimba rezultatul. Dar sunt stupefiat de eroarea de peste 1,5% la numararea initiala a voturilor nule. Ce garantie pot avea ca nu s-ar fi putut produce erori similare la numararea voturilor valabile pentru cei doi candidati? Nu spun ca s-au produs, ci doar ca pare sa existe o marja de eroare considerabila... LA NUMARARE! (unde teoretic marja de eroare ar trebui sa tinda spre zero).
    Nu sunt statistician, dar am totusi la baza o formatie de tip ingineresc :) Ar fi doua argumente posibile pe care le-as putea intelege:
    - ca voturile nule sunt cumva mai greu de judecat decat cele valabile (ambiguitati? posibile interpretari diferite?)
    - ca numarul erorilor nu este proportional cu numarul voturilor procesate, ci la numere mari (de genul celor peste 5 milioane primite de fiecare candidat) proportia erorilor scade semnificativ; nu mi-e clar de ce ar fi asa, dar vad ca la numere mici (voturi nule in strainatate) proportia erorilor poate fi enorma (12%), dar pare sa scada la numere mari (totalul voturilor nule - eroare de 1,55% la numarare).
    Se poate sustine vreuna din aceste explicatii? Sau alta?

    ReplyDelete