bgmt: (Default)
bgmt ([personal profile] bgmt) wrote2008-01-18 05:36 pm

Добавление к предыдущему посту

У меня, к сожалению, нет времени подробно разобраться во всей статистике результатов выборов. Надо сказать, что советская власть так бы не прокололась, я думаю, у них были специалисты грамотнее. Ну, про больше ста процентов за ЕР все слышали уже, про сто процентов явки в Ингушетии, где уже неделю назад 50 тысяч человек подписали заявление, что не ходили на выборы, тоже все слышали. Некоторое время назад много у кого в ЖЖ был приведён замечательный график - почти абсолютная корреляция процента явки и процента голосовавших за ЕР (для гуманитаров: т.е. если, предположим, явилась половина избирателей, то из неё, предположим, 50% голосовало за ЕР, т.е. 25% от общего числа зарегистрированных избирателей; а где явилось, предположим, 80%, там из них за ЕР оказалось, предположим, 90%, т.е. 72% от зарегистрированных; цифры я беру с потолка, это неважно, важно, что в результате зависимость числа голосов, поданных за ЕР, от числа пришедших голосовать оказывается не линейной, а квадратичной, чего не может быть ну никак.)

А сейчас появился ещё один график, который я сначала увидел у [livejournal.com profile] object'а.

График сделан юзером [livejournal.com profile] podmoskovnik, который поясняет: "Данные скачаны мной с сайта Центризбиркома и выложены в открытый доступ; в записи http://podmoskovnik.livejournal.com/5241.html есть ссылки, а в ссылках - readme с пояснениями методики."

Мне понадобились пояснения, и я их получил (т.е. я получил от [livejournal.com profile] podmoskovnikа цифры и воспроизвёл у себя на Экселе график). Реальный процент явки округлялся до целого, так что точка, соответствующая 49%, значит "число избирательных участков, где явка была между 48,5% и 49,5%". Нормально было бы ожидать довольно плавную огибающую, иногда чуть рваную из-за флуктуаций. А имеем мы вот что: локальные максимумы распределения располагаются в точках 55%, 60%, 70%,75%, 80%, 85%, 95%, 100%. Точке 65% не повезло - попала на склон, и в ней только излом. [livejournal.com profile] podmoskovnik меланхолически замечает "Все-таки привычка красить траву нас однажды погубит."

Ну мало того, что стопроцентная явка (т.е. от 99,5 до 100%) имела место на 4940 избирательных участках и является абсолютным максимумом, но вот, скажем, 59% избирателей явилось на 2260 участков, и эта точка на склоне, но явка в 60% была обеспечена уже на 2460 участках (рывок вверх на кривой у 60%); то же самое имеет место между 69 и 70% и между 79 и 80%.
Я привожу цифры, потому что на глаз мне сначала показалось, что эти прямые отрезки шириной в 2%; нет, в 1%.
Мне лень подсчитывать вероятность такого распределения. Она слишком близка к нулю.
Я ещё раз повторяю: округление было не до 5%, а до 1%. Никаких причин для такого графика, кроме заведомой фальсификации, нет.

[identity profile] object.livejournal.com 2008-01-18 04:59 pm (UTC)(link)
Спасибо за вашу дотошность. Посмотрев на численные данные, я, надо сказать, прибалдел. Настолько отклоняются результаты для явки по числам, кратным пяти.

[identity profile] katyat.livejournal.com 2008-01-18 04:59 pm (UTC)(link)
Вот чего меня удивляет - это поиск отклонений в средних и моментах для доказательства фальсификации. Фальсификация была наблюдаема непосредственно без математического аппарата.
Это при СССР можно было найти отклонение в третьем знаке и сказать:а-а-а, попались!

[identity profile] bgmt.livejournal.com 2008-01-18 05:19 pm (UTC)(link)
Ну ты права, конечно. Интересна степень безграмотности. А ещё интересно, что эти данные показывают, что липовые цифры не были буквально спущены сверху, а обеспечивались неграмотными председателями комиссий. Т.е. видимо, сверху говорили "ну обеспечьте нам 70%", имея в виду "вокруг 70%", но комиссия обеспечивала в точности 70%. Иначе я этого объяснить не могу.
Это раз. Два - "наблюдаема непосредственно" всегда встречает возражение "это вы наблюдали в одном месте, а вот в других!". И нечего сказать. А тут есть чего.

[identity profile] bgmt.livejournal.com 2008-01-18 05:21 pm (UTC)(link)
Да, ещё одно возражение. Я думал, что масштаб меньше. Собственно, меня интересует только один вопрос: сколько народу реально хотели голосовать за Путина? Казалось, что подделка совершенно ни к чему, что их и так навалом. Я перестаю быть в этом настолько уверен. Хотя и в обратном, конечно, тоже.

[identity profile] katyat.livejournal.com 2008-01-18 05:39 pm (UTC)(link)
ТАк в этом и особенность сегодняшнего момента - не безграмотность, а просто нежелание заметать следы.
Причем мне кажется, что это не только российское явление. И здесь официальной версией может стать то, что ne tient pas debout.
Времена министерства правды прошли.

[identity profile] muh2.livejournal.com 2008-01-18 05:45 pm (UTC)(link)
У меня знакомый защитил на эту тему (доказательство фальсификации на выборах статистическим анализом) дисер в Калтехе. На материалах выборов каких-то очередных Кеннеди и, кажется, выборов Ельцина в 96-м. Пипл-схавает.

Но, надо заметить, что представленный здесь график, за исключением освяшщенного Розовой Революцией пика около 100% выглядит не слишком страшно. Пресловутые пички не сильно и за шум-то выбиваются. Если оценить масштаб фальсификаций как интерал модуля отклонения от среднего, то получится сколько - жалкие одноцифренные проценты?

[identity profile] bgmt.livejournal.com 2008-01-18 06:01 pm (UTC)(link)
Не согласен. Это уже вопрос экстрастатистический, требующий привлечения гипотез по механизмам воздействия. ЕСЛИ БЫ директива была "сделайте нам процент, кратный пяти", то Вы были бы правы. ТАкой директивы быть не могло, так ведь? Значит, надо восстановить указания. В моём понимании природы вещей указания могли только иметь форму "сделайте нам 65%", или другой какой процент на другом участке. А тогда приходится заключить, что делали (излишне точно), исходя из любого материала. Значит, оценка масштаба фальсификаций как интерал модуля отклонения от среднего не катит.
Ну и это подтверждается стопроцентным пиком, конечно.

(Да, а если кто попытается защитить диссер на ровно ту же тему в России, взяв Кеннеди и ЕР? Предсказания? Это так, к вопросу о "всюду то же самое").

[identity profile] migmit.vox.com (from livejournal.com) 2008-01-18 06:17 pm (UTC)(link)
Угу, согласен. Даже траектория полёта камня не точная парабола и даже не уточнённый эллипс, там свои извивы найдутся, если присмотреться хорошо. Чего уж говорить про политику, где чётких законов не имеется.

[identity profile] just-tom.livejournal.com 2008-01-18 06:17 pm (UTC)(link)
Про красить траву понравилось.

[identity profile] muh2.livejournal.com 2008-01-18 06:22 pm (UTC)(link)
/Значит, надо восстановить указания. /

Если они были. Я думаю, если и были, то в форме "Ну вы уж там не подкачайте". А уж понимал всякий в меру своей преданности. Но, понятно, что процент должен был быть юбилейным. "Ну вот до 65% дотянем - и по домам".

Дисер? Думаю, вполне возможно.

[identity profile] object.livejournal.com 2008-01-18 06:32 pm (UTC)(link)
Такие цифры позволяют лучше оценить масштабы фальсификации. И даже примерно предположить число приписанных голосов.

[identity profile] muh2.livejournal.com 2008-01-18 06:35 pm (UTC)(link)
Опять насчет дисера - попытки найти референсную кривую навели на вопрос - а почему ее так тяжело найти?

[identity profile] katyat.livejournal.com 2008-01-18 06:36 pm (UTC)(link)
В предположении, что были честные и нечестные результаты. И что фальсификация была только пpо-Путинская. И что там, где нет видимых статистических ляпов - правда...

[identity profile] http://users.livejournal.com/_shadow__/ 2008-01-18 06:37 pm (UTC)(link)
можно попробовать сделать спектральный анализ. Там моды на частотах, кратных пяти, вроде бы должны очень наглядно проявиться.

[identity profile] bgmt.livejournal.com 2008-01-18 06:38 pm (UTC)(link)
Не похоже (про указания). Я забыл, конечно, где я читал, но читал - про фантастическое совпадение результатов по (не помню, какого масштаба образований, не отдельных участков, конечно) с прогнозами. Ну совершенно без отклонений. Так что думаю, указывали точнее, чем "не подкачайте".

[identity profile] just-tom.livejournal.com 2008-01-18 06:47 pm (UTC)(link)
И ещё понравилось, что выше всего пики на числах, кратных десяти.

[identity profile] ygam.livejournal.com 2008-01-18 06:48 pm (UTC)(link)
Нужно послать Тафту (http://www.edwardtufte.com/tufte/books_vdqi).

[identity profile] bgmt.livejournal.com 2008-01-18 06:50 pm (UTC)(link)
какую кривую сложно найти? Данные есть, посмотрите у [info]podmoskovnikа в ссылке. (Правда, я не понял тут слово "референсную").

[identity profile] bgmt.livejournal.com 2008-01-18 06:52 pm (UTC)(link)
Ну я не буду. Лень. Чтоб я своё родное фурье на такую гадость тратил...

[identity profile] bgmt.livejournal.com 2008-01-18 06:58 pm (UTC)(link)
А ты посмотри ещё у подмосковника - я просто уже спёкся - он именно выделяет аномальную часть и показывает, что она пропутинская. Не в этом посте.

[identity profile] bgmt.livejournal.com 2008-01-18 06:59 pm (UTC)(link)
ну, такого ж много на свете.

[identity profile] ygam.livejournal.com 2008-01-18 07:03 pm (UTC)(link)
Все равно я ему это послал. Вдруг он это включит в новое издание The Visual Display of Quantitative Information?

[identity profile] muh2.livejournal.com 2008-01-18 07:05 pm (UTC)(link)
Кое-что нашлось.

http://www.msg.com.mx/~kovalski/IFE2006/Histogramas/Election%20turnout%20paper%20revised%209-04.doc

Как и следовало ожидать, в Штатах кривая - примерно Гауссова. То есть возможно вся правая нессиметричная часть - жульничество. С другой стороны - другая упомянутая кривая (зависимость %за одну из партий от явки) выглядит не сильно отличающейся от американских, на которых тоже вполне такой себе резвый наклончик.

кратные 5%-ам пики

[identity profile] ixodus.livejournal.com 2008-01-18 07:11 pm (UTC)(link)
Вот что надо бы сделать для чистоты эксперимента -- это исключить из выборки Ингушетию, Чечню, Дагестан, вообще, по- видимому все кавказские автономии, а также Мордовию, весь Татарстан ( кроме Казани и, м. б. Набережных Челнов), и по такому же рецепту поступить с Башкортостаном. После этого посмотреть как в оставшейся выборке будет с кратными пяти пиками.

Дело в том, что в отношении предложенных для отсеивания регионах как бы и нет никакого сомнения вообще по поводу методов подведения итогов голосования. По другим же регионам есть различные предположения в зависимости от конкретного места. Скорее всего на части участков вообще значимо не фальсифицировали, на части -- вбрасывали, ещё на части возможно
и выбрасывали или просто подрисовывали. Но сочетание разнородной выборки по большинству российских регионов с однородной по принципу подведения итогов("рисование") выборкой автономий, в определённой степени химериризирует получающуюся итоговую (тотальную) выборку.

Re: кратные 5%-ам пики

[identity profile] bgmt.livejournal.com 2008-01-18 07:47 pm (UTC)(link)
Весьма разумно. Только кто это сделает?

Page 1 of 7