суббота, 10 декабря 2011 г.

Статистический анализ результатов выборов в России

Как исследовать накопившийся массив данных сплошного исследования, редкого эксперимента, которым являются выборы в России? Ведь кроме простой суммы голосов из этой базы данных можно вытянуть очень много инсайта, воспользовавшись обычными статистическими инструментами. И не обязательно все усложнять до деревьев классификации или искусственных нейросетей. Достаточно посмотреть графики рассеяния или простейшие статистические тесты. 
Этим уже занимаются специалисты-статистики. В 2009 году Сергей Шпилькин опубликовал в Троицком Варианте [1] подробный анализ Российских выборов 2007-2009. В котором привел убедительные доказательства фальсификаций и манипуляций в ходе голосования. 
В качестве примера приведу один из наглядны графиков Сергея Шпилькина.
Рис. 1. Голосование избирателей за партии на выборах в Государственную Думу РФ 2007 г. Данные по избирательным округам субъектов РФ

В своем блоге автор пишет "Выборы у нас бывают редко и проходят все скучнее, поэтому для тех, кому это все же интересно, здесь собраны в хронологическом порядке ссылки на посты этого журнала, посвященные анализу результатов голосований.. " и приводит обширный список ссылок на результаты исследований данных по выборам. 
Не обошел своим внимание ученый и парламентские выборы 2011 года. Результаты опубликованы в статье "Статистика исследовала выборы" в Газете.ру [2]. 
Как и в первом случае, автор довольно подробно и доказательно приводит анализ фальсификаций. Пример:
Рис. 2. Голосование избирателей на выборах в Государственную Думу РФ.

Судя по распределению данных отличному от нормального (Гауссово), которое характерно для результатов выборов цивилизованных стран, наше отличается нездоровым смещением вправо. Цитата: "Распределения участков по явке не имеют колоколообразной формы,как на приведенных выше графиках для зарубежных странВ первую очередь это касается области высоких явокгде распределение не снижается симметрично начальному участкуа остается на высоком уровне вплоть до явок в 100%. Другими словамина наших выборах завышено количество участков с высокой явкой."
Подробные официальные результаты выборов различных уровней теперь собраны в удобном для обработки виде на сайте http://stat.golos.org.


Ссылки:
1. Статистическое исследование результатов российских выборов 2007 - 2009 гг
27 октября 2009 г. ТрВ № 40, c. 2, "Наука и общество"
Сергей Шпилькин.

2. "Статистика исследовала выборыСтатистический анализ выборов в Госдуму 2011 года показывает возможные фальсификации". Сергей Шпилькин http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml

Комментариев нет:

Отправить комментарий