bgmt: (Default)
bgmt ([personal profile] bgmt) wrote2008-01-18 05:36 pm

Добавление к предыдущему посту

У меня, к сожалению, нет времени подробно разобраться во всей статистике результатов выборов. Надо сказать, что советская власть так бы не прокололась, я думаю, у них были специалисты грамотнее. Ну, про больше ста процентов за ЕР все слышали уже, про сто процентов явки в Ингушетии, где уже неделю назад 50 тысяч человек подписали заявление, что не ходили на выборы, тоже все слышали. Некоторое время назад много у кого в ЖЖ был приведён замечательный график - почти абсолютная корреляция процента явки и процента голосовавших за ЕР (для гуманитаров: т.е. если, предположим, явилась половина избирателей, то из неё, предположим, 50% голосовало за ЕР, т.е. 25% от общего числа зарегистрированных избирателей; а где явилось, предположим, 80%, там из них за ЕР оказалось, предположим, 90%, т.е. 72% от зарегистрированных; цифры я беру с потолка, это неважно, важно, что в результате зависимость числа голосов, поданных за ЕР, от числа пришедших голосовать оказывается не линейной, а квадратичной, чего не может быть ну никак.)

А сейчас появился ещё один график, который я сначала увидел у [livejournal.com profile] object'а.

График сделан юзером [livejournal.com profile] podmoskovnik, который поясняет: "Данные скачаны мной с сайта Центризбиркома и выложены в открытый доступ; в записи http://podmoskovnik.livejournal.com/5241.html есть ссылки, а в ссылках - readme с пояснениями методики."

Мне понадобились пояснения, и я их получил (т.е. я получил от [livejournal.com profile] podmoskovnikа цифры и воспроизвёл у себя на Экселе график). Реальный процент явки округлялся до целого, так что точка, соответствующая 49%, значит "число избирательных участков, где явка была между 48,5% и 49,5%". Нормально было бы ожидать довольно плавную огибающую, иногда чуть рваную из-за флуктуаций. А имеем мы вот что: локальные максимумы распределения располагаются в точках 55%, 60%, 70%,75%, 80%, 85%, 95%, 100%. Точке 65% не повезло - попала на склон, и в ней только излом. [livejournal.com profile] podmoskovnik меланхолически замечает "Все-таки привычка красить траву нас однажды погубит."

Ну мало того, что стопроцентная явка (т.е. от 99,5 до 100%) имела место на 4940 избирательных участках и является абсолютным максимумом, но вот, скажем, 59% избирателей явилось на 2260 участков, и эта точка на склоне, но явка в 60% была обеспечена уже на 2460 участках (рывок вверх на кривой у 60%); то же самое имеет место между 69 и 70% и между 79 и 80%.
Я привожу цифры, потому что на глаз мне сначала показалось, что эти прямые отрезки шириной в 2%; нет, в 1%.
Мне лень подсчитывать вероятность такого распределения. Она слишком близка к нулю.
Я ещё раз повторяю: округление было не до 5%, а до 1%. Никаких причин для такого графика, кроме заведомой фальсификации, нет.

[identity profile] muh2.livejournal.com 2008-01-18 06:35 pm (UTC)(link)
Опять насчет дисера - попытки найти референсную кривую навели на вопрос - а почему ее так тяжело найти?

[identity profile] bgmt.livejournal.com 2008-01-18 06:50 pm (UTC)(link)
какую кривую сложно найти? Данные есть, посмотрите у [info]podmoskovnikа в ссылке. (Правда, я не понял тут слово "референсную").

[identity profile] muh2.livejournal.com 2008-01-18 08:14 pm (UTC)(link)
Имеется в виду - кривую из предположительно честных выборов.

[identity profile] filin.livejournal.com 2008-01-18 11:54 pm (UTC)(link)
Очевидно, что на 0% и на 100% должны быть практически нули. Пик вблизи 100% невероятен, но с ним и так все ясно.

Однако серьезные сомнения вызывает вообще весь правый фронт. Судя по нижеприведенным американским аналогам, справа от максимума должен быть плавный спад, и весь пик примерно симметричен (левый фронт даже более пологий). То есть уже для 75% это должен быть почти ноль (не больше, чем для 35%).

Получается вроде как, что все, что выше 70% - чистая липа. Площадь под соответствующим участком кривой считайте сами :-)

[identity profile] -sergey.livejournal.com 2008-01-19 10:20 pm (UTC)(link)
А в отдельной деревне из 10 домов УИК отдельный есть? Если есть, то пик около 100% неудивителен... А вот всплески повеселили

[identity profile] filin.livejournal.com 2008-01-19 10:37 pm (UTC)(link)
Строго говоря, с учетом разной численности избирателей на участках надо бы перестроить график, чтобы по вертикали было не количество участков, а количество людей, на них проголосовавших. Это правда.

А вопрос не так прост - как вообще должна зависеть явка от численности избирателей на участке и почему? Казалось бы, дело не в самой численности, а в специфике (воинские части и т.п.) - почему, собственно, на "обычном" участке в две тысячи человек явка должна быть больше, чем на "обычном" же участке в двадцать тысяч?

[identity profile] ksl-aka-serg.livejournal.com 2008-01-21 10:04 am (UTC)(link)
И специфика, и численность влияют, конечно. Обеспечить явку в 100% на поселковом избирательном участке, как два байта переслать. Поставил каждому проголосовавшему по бутылке пива, и дело в шляпе. При этом, сам по себе высокий процент явки означает, что это фальсификация. Фальсификация это вброс биллютеней, другие черные технологии, типа каруселей.

[identity profile] muh2.livejournal.com 2008-01-18 07:05 pm (UTC)(link)
Кое-что нашлось.

http://www.msg.com.mx/~kovalski/IFE2006/Histogramas/Election%20turnout%20paper%20revised%209-04.doc

Как и следовало ожидать, в Штатах кривая - примерно Гауссова. То есть возможно вся правая нессиметричная часть - жульничество. С другой стороны - другая упомянутая кривая (зависимость %за одну из партий от явки) выглядит не сильно отличающейся от американских, на которых тоже вполне такой себе резвый наклончик.

[identity profile] bgmt.livejournal.com 2008-01-19 03:01 am (UTC)(link)
ну не с корреляцией 90%?

[identity profile] muh2.livejournal.com 2008-01-19 09:09 am (UTC)(link)
Тут надо сообразить, как считать корреляцию. Во Флориде линейная подгонка меняется от +30 процентов в малых явках, до -20 - в больших.