Методы политических отношений

Методы политических исследований.

Курс лекций

1-лекция. ПРОЦЕСС ИССЛЕДОВАНИЯ

Любопытство и необходимость – вот важнейшие мотивы, лежащие в основе человеческого познания. Мы пытаемся понять мир вокруг нас и ради знания и самозащиты, и ради облегчения своей судьбы. В любом случае мы получаем хотя бы потенциально способ исправить существующий порядок вещей. Иными словами, чем больше мы узнаем об окружающем нас мире, тем больше возможностей для управления им мы получаем. В отношении политики это так же справедливо, как и в других областях. Чтобы иметь ключ к ее пониманию и изменению, надо всего лишь больше знать о ней.

Однако эта простая мысль о необходимости знания ставит два совсем не простых вопроса. Как мы получаем знание? Как следует использовать то, что мы знаем? Первый вопрос – это вопрос о методе, второй – об этике и предпочтении. В первом случае нас интересует приобретение и организация знания; во втором – мы имеем дело с неразрывно связанными с этим процессом моральными обязательствами. И в том и другом случае необходимы оценки, основанные на нашем опыте и требующие разных интеллектуальных усилий.

Для решения вопроса о том, как мы получаем знание, следует сформулировать жесткие правила определения политической реальности. Например, мы могли бы определить политическую реальность как результат нашего восприятия исследования политической системы, что представляется достаточно простым. Однако что такое политическая система? О какого рода исследованиях мы говорим? Учли ли мы все возможные политические события или наше определение является неоправданно ограниченным? От чего зависит политическая реальность: от наблюдателя, как следует из нашего определения, или от самой системы? С помощью такого определения разные наблюдатели, имеющие разный опыт и разные точки зрения, [c.19] не только будут иметь разное представление о политической реальности, но и получат его разными способами. В результате может возникнуть совокупность знаний, носящих в высшей степени индивидуальный характер, при отсутствии какого бы то ни было механизма передачи этих знаний другим людям. Таким образом, проблема определения того, как мы получаем знание, – это проблема достижения общепринятого способа описания действительности на общепринятом языке исследования, так чтобы каждый, изучивший правила или “владеющий языком”, мог бы на основе единого понимания общаться со всеми теми, кто обучен тому же самому. По крайней мере теоретически, если бы мы все смогли прийти к единому мнению о том, как мы получаем знания, мы в конце концов смогли бы договорить и по гораздо более сложному вопросу о том, что мы знаем.

Принятие решения о том, как следует использовать то, что мы знаем, – процесс совсем иного рода. Здесь уже нет необходимости в общепринятом или едином для всех выборе, хотя мы все же нуждаемся в общем языке, дающем возможность общения и обсуждения. В конце концов, решение о лучшем или наиболее желательном приложении знаний носит субъективный, индивидуальный характер. У каждого из нас есть свои желания и потребности, которые могли бы заставить нас оценить некий результат более высоко, чем другой, и нет никакой необходимости (хотя, возможно, это было бы желательно), чтобы мы пришли к какой-то общей оценке. Если снизить налоги, люди среднего достатка стали бы жить лучше, однако расходы на социальное обеспечение, предназначенные в первую очередь для бедных, пожилых и больных, были бы сокращены. Следует ли снижать налоги? Совершенно очевидно, что ответ на этот вопрос зависит не от того, что мы знаем, а от того, как знания связаны с нашей социальной позицией и системой ценностей. Идеология и политическая система предоставляют средства для структурирования и сведения в единое целое предпочтений, сделанных отдельными людьми, однако само решение каждый человек выносит, не обращаясь к какой-либо общей точке зрения.

Для разграничения этих двух сфер политологи используют специальные понятия. В первом случае, когда речь идет о том, как мы получаем знания и что мы знаем, употребляется [c.20] термин “эмпирический анализ”. Во втором случае, когда речь идет о том, как следует использовать наши знания, употребляется термин “нормативный анализ”. Эмпирический анализ – это разработка и использование общего для всех, объективного языка для описания политической реальности. Язык может быть количественным, основанным на статистическом сравнении характеристик различных объектов или случаев; или может быть качественным, основанным на понимании тех же самых объектов или случаев исследователем, владеющим информацией¹. Нормативный анализ – это разработка и изучение субъективных целей, ценностей и этических норм, которыми мы руководствуемся при использовании наших знаний о реальности.

Возможно, разницу между этими двумя понятиями лучше всего иллюстрируют герои оригинального телевизионного сериала “Star Trek”. Мистер Спок, робот-офицер, олицетворял эмпирический менталитет. Спок интересовался лишь тем, что может быть научно изучено или сформулировано, и ни в малейшей степени его не занимало то, что иррационально чувствовали или предпочитали его товарищи, люди. Он отмечал и измерял реальность, но он не имел мнения о ней, не анализировал ее. Доктор Маккой, напротив, являл собой нормативный менталитет. Хотя и воспитанный на научных методах, он неизменно руководствовался более предпочтениями и неким чувством правильности, нежели логикой и ощущением того, что что-то будет действовать и работать. И наконец, Джеймс Керк, капитан звездного корабля, был образцом синтеза альтернатив эмпирического и нормативного мышления. Он пользовался знаниями и талантом делать обоснования Спока, но регулировал его трезвую рассудительность моральным чувством Маккоя. Не будучи приверженцем ни одной из этих полярных точек, он черпал из обеих традиций, а результатом был неизменный успех.

В таком синтезе капитана Керка есть урок и для нас, поскольку нормативный анализ без эмпирической основы может привести к ценным выводам, которые не соприкасаются с реальностью. А эмпирический анализ при отсутствии способности к нормативным заключениям, с другой стороны, может привести к созданию фактической структуры в вакууме. Она будет представлять собой [c.21] коллекцию наблюдений, значение которых мы не в состоянии понять до конца. Возвращаясь к нашему предмету, можно сделать вывод, что политологический запрос есть использование равно обоих типов анализа – эмпирического и нормативного – путем максимального привлечения не только знаний, но и понимания политической реальности. Таким образом, несмотря на то, что акцент в этой книге делается на политический анализ, нашей целью является, в дополнение к освоению разнообразных гибких аспектов эмпирической техники, развитие понимания более широкой – а именно нормативной – перспективы, внутри которой наши знания будут интерпретироваться.

В этом контексте мы можем рассматривать научное исследование как (1) создание философии языка запроса и как (2) собственно накопление знаний. Уточним – не просто знаний, но таких, которые наиболее эффективно послужат нам для множества различных целей и случаев. Ведь люди могут получать знание из собственного опыта, но не у всех опыт одинаков. Люди могут накапливать информацию, просто глядя на мир открытыми глазами, но нет уверенности, что путем такого бессистемного наблюдения они заметят все или хотя бы наиболее значимые относящиеся к делу события. Некоторые люди могут “узнавать” вещи посредством галлюцинаций, видений или слушая “голоса”, а другие могут рассматривать полученные знания как достоверные, но не все могут овладеть такими фантастическими и непрактичными методами. Каждый из вышеперечисленных способов познавания чего-либо так или иначе используется, но ни один из них не позволяет полностью совместить и непосредственно факты и заключения, и знание того, какими методами эти факты или выводы были получены. Каждый метод позволяет сообщать информацию, но ни один из них не может помочь достигнуть исчерпывающего, полноценного понимания. И только научное исследование позволяет осуществить все это, и даже больше. Под научным исследованием мы понимаем запрос, руководствующийся научными методами. Причина такой действенности в том, что оно не только позволяет познавать реальность и оценивать способы, которыми мы добыли это знание, но - в силу того, что эти способы широко осознаются теми, кто ими [c.22] владеет, – оно также дает нам возможность усовершенствовать наши методы запроса. Научное исследование – это самокорректирующийся, постоянно развивающийся способ познавания.

Объясняется это тем, что научное исследование обладает свойствами эксплицитности, системности и контролируемости. Эксплицитность научного исследования состоит в том, что все правила для описания и изучения реальности сформулированы в явном виде. Ничто не утаивается, ничто не принимается на веру. Системность заключается в том, что каждый зафиксированный факт связан причинной связью или наблюдается вместе с другими фактами. Не признаются никакие объяснения, пригодные лишь на данный случай, не допускается никаких отступлений от метода. Контролируемость выявляется в том, что анализируемые явления по возможности рассматриваются со всей строгостью, допустимой в данной ситуации. Обобщения делаются только после самой доскональной и тщательной оценки под девизом осторожности, что в более широком смысле означает постоянное внимание к деталям. И все же, несмотря на все свои ограничения, или, вернее, именно благодаря им, научное исследование открывает тому, кто идет этим путем, совершенно новый уровень познания реальности. Именно поэтому научный метод и применяется для изучения политики.

Как дисциплина политология еще не стала “научной”. Самые первые политологи получали не столько философское, сколько социологическое образование. (Правда, последнее тогда не существовало как таковое). Большинство ранних работ эмпирического толка носили характер интерпретации и были относительно мало структурированы, и даже сегодня существует разница во мнениях относительно того, чего современный практик может или должен достигнуть. Тем не менее, начавшись в 40-х годах и набирая темп с конца 50-х, применение научного подхода к описанию и пониманию политических феноменов стало занимать главенствующие позиции, по крайней мере в Соединенных Штатах. И по мере этого все больше и больше политологов убеждалось, что такой подход дает важную возможность проникновения в суть поведения отдельных личностей, политических организаций и правительств. [c.23]

Данные рассуждения позволяют определить научное исследование как “систематическое, контролируемое, эмпирическое и критическое исследование гипотетических утверждений о предполагаемых отношениях между [различными] явлениями”². Эту фразу не очень-то легко выговорить, однако она довольно точно передает основные положения, которые мы обсуждаем. Научное исследование, в данном случае специальное научное исследование, – это метод проверки теорий и гипотез путем применения определенных правил анализа к данным, полученным в результате наблюдений и интерпретации этих наблюдений в строго заданных условиях. Именно эти правила и ограничения мы должны изучить, если перед нами стоит задача приобретения знаний в области политологии.

Вероятно, лучше всего начать изучение этих правил и ограничений, обратившись с вопросом к самому себе. Как осуществляется исследование политики? В соответствии с постановкой вопроса такое исследование лучше считать не множеством наблюдений или теорий, а процессом сбора и интерпретации информации. Этот процесс состоит из шести самостоятельных, но вместе с тем тесно связанных друг с другом этапов: (1) формулирование теории, (2) операционализация теории, (3) выбор адекватных методов исследования, (4) наблюдение за поведением, (5) анализ данных и (6) интерпретация результатов. В соответствии с этими шестью этапами построена большая часть настоящей книги, и поэтому рассмотрим их более подробно. [c.24]

ФОРМУЛИРОВАНИЕ ТЕОРИИ

Первым шагом политологического исследования является выбор проблемы исследования, и сразу становится совершенно очевидной важность объединения нормативного и эмпирического подходов. Каковы те критерии, в соответствии с которыми одна исследовательская проблема считается более интересной, чем другая? И хотя в голову приходит множество таких критериев, начиная отличных интересов исследователя и кончая интересами общества в целом, большинство критериев все же разбивается на два основных типа. Проблема заслуживает изучения либо потому, что она отвечает некоторой конкретной потребности, т.е. ее решение послужит лучшему теоретическому познанию явления, либо потому, что она отвечает [c.24] определенной социальной потребности, т. е. ее решение может помочь нам справиться с тем или иным вопросом, встающим перед обществом.

Хотя эти два типа проблем, часто называемых фундаментальными и прикладными исследованиями, не являются взаимоисключающими (если вы занимаетесь одной проблемой, это не означает, что вы ни в коем случае не можете одновременно заниматься и другой), тем не менее они часто находятся в состоянии конкуренции. Можно, например, исследовать гипотетические факторы, вызывающие агрессию в условиях стресса, в целях разработки сложной прогностической модели человеческого поведения, а можно вместо этого сосредоточиться на причинах возникновения взрывов и способах их предотвращения. Можно детально изучать процессы принятия решений государственными деятелями с целью понимания феномена лидерства, а можно вместо этого сосредоточить внимание на выявлении решений, способных привести к войне, и на возможностях их избежать. Поскольку для изучения всех потенциально интересных или важных исследовательских проблем имеется слишком мало научных ресурсов (финансов, времени и квалифицированных специалистов), нередко возникает конфликт между необходимостью осуществить фундаментальное исследование (практические результаты, сколь бы ни были значительными, почти всегда ощущаются лишь косвенно и в отдаленном будущем) и необходимостью использовать наши научные знания в настоящий момент непосредственно на благо общества, даже если при этом будет задержано или вовсе остановлено развитие науки. Выбор должен сделать конкретный исследователь в соответствии с его (или ее) собственной системой ценностей.

Определив характер проблем, с которыми мы хотим иметь дело, и характер результатов, которых мы хотим достичь, мы должны затем более конкретно сформулировать задачу исследования. Такое решение диктуется рядом соображений. Прежде всего, необходимо выделить тот аспект проблемы, который нас более всего интересует. После того, как радостное возбуждение, сопровождающее начало поисков, несколько угаснет, и до момента, когда впереди начинают маячить ответы на поставленные вопросы, ежедневная рутинная работа может оказаться довольно [c.25] скучной. В такие периоды собственно интерес к проблеме становится важным мотивом исследования, так сказать, интеллектуальной закуской, поддерживающей наши силы до подачи на стол основного блюда. Поскольку решение любой исследовательской проблемы требует изнурительной работы, одна из величайших ошибок, которую мы можем совершить, – это выбрать задачу, вызывающую у нас мало интереса.

После того как определена интересующая нас тема исследования, необходимо тщательно проанализировать различные элементы, или компоненты, этой темы и выявить те из них, которые могут иметь значение для нашего исследования. Для установления основных факторов поведения необходимо использовать наше умение наблюдать и делать выводы, а также, в особенности, проведенные ранее исследования по сходной тематике, как наши собственные, так и выполненные другими исследователями. Попробуем пояснить сказанное на примере.

Представим себе расположенный в центре пустыни городок под названием Малая Америка. В нем нет ничего, кроме станций обслуживания и ресторанов, протянувшихся на несколько миль от въезда в город до самого горизонта. Единственное, что можно сделать в Малой Америке, – это поесть и заправить машину.

Теперь предположим, что мы захотели исследовать поведение жителей Малой Америки на президентских выборах, чтобы уметь объяснить, почему одни голосуют за кандидата демократов, другие – за кандидата республиканцев. В этом упрощенном примере объекты нашего анализа (жители Малой Америки) отличаются друг от друга (помимо способа голосования) по двум параметрам: каждый из них является либо владельцем предприятия, либо рабочим и связан либо со станцией обслуживания, либо с рестораном. Каждый из этих факторов (политологи называют их переменными) представляет собой характеристику отдельного человека. Один житель Малой Америки может быть (1) служащим (2) ресторана, который (3) голосует за демократов, тогда как другой – (1) владельцем (2) станции обслуживания, который (3) голосует за республиканцев. Поскольку мы хотим объяснить различия в голосовании, опираясь на различия между избирателями, мы должны сосредоточить свое внимание на всех тех [c.26] факторах, которые могли бы иметь отношение к их выбору. В данном случае в нашем распоряжении имеется только два таких фактора: статус служащего или владельца и отношение к станции обслуживания или к ресторану. Будем называть их соответственно: социально-экономическим статусом (СЭС) (при этом статус владельца выше статуса служащего) и родом занятий. Есть ли какие-либо основания считать, что, зная обе характеристики конкретного избирателя, мы сможем предсказать, кому он (или она) отдаст предпочтение при голосовании?

Чтобы ответить на этот вопрос, необходимо сделать две вещи. Во-первых, необходимо поразмышлять. Следует спросить себя: существуют ли какие-нибудь логические допущения ожидать, что один из этих факторов окажет влияние на голосование? Во-вторых, следует обратиться к литературе по политологии и посмотреть, есть ли в проводившихся ранее исследованиях по данной или смежным проблемам какие-либо эмпирические данные, указывающие, как тот или иной фактор влияет на поведение избирателей. В действительности в данном случае почти нет оснований считать, что на голосовании сколько-нибудь заметно скажется род занятий. Конечно, между теми, кто имеет отношение к станциям обслуживания, и теми, кто имеет отношение к ресторанам, вполне могут существовать различия, однако не похоже, чтобы эти различия имели большое влияние на результат президентских выборов. Не много найдется кандидатов в президенты, которые бы предлагали программу, направленную в защиту станций обслуживания и против ресторанов (или наоборот), так что не похоже, чтобы при прочих равных эта переменная как-то способствовала объяснению поведения на выборах. Совсем иначе обстоит дело со второй переменной – социально-экономическим статусом. Поскольку принято считать, что демократическая партия является партией трудящихся, а республиканская – партией деловых кругов, и поскольку избиратели с более высоким СЭС скорее будут голосовать за республиканцев, чем избиратели с более низким СЭС, вполне допустимо, что служащие скорее будут голосовать за кандидата демократов, а владельцы предприятий – за кандидата республиканцев. И действительно, имеющиеся исследования изобилуют примерами, демонстрирующими именно такое [c.27] соотношение. Таким образом, и теоретические рассуждения, и эмпирические факты говорят об одном и том же. Отсюда проблема нашего исследования может быть сформулирована следующим образом: оказывает ли СЭС избирателя – жителя Малой Америки воздействие на то, за кого данный избиратель голосует на президентских выборах?

Конечно, в реальном мире люди отличаются друг от друга столь значительно, что это не может быть описано двумя-тремя признаками, однако проблема, возникающая при постановке задачи исследования, в принципе та же самая. Поскольку мы не имеем возможности измерить все мыслимые переменные, мы должны обдуманно и обоснованно выбрать из многих тысяч характеристик людей (или организаций) те немногие характеристики, которые, как представляется, помогут объяснить интересующие нас аспекты поведения. С помощью логических рассуждений и имеющихся в литературе данных мы должны попытаться предусмотреть и выявить те факторы, которые предположительно связаны с этим поведением. Поступая таким образом, мы не предрешаем результаты исследования, как это может показаться на первый взгляд, а, скорее, вырабатываем более продуктивный подход к проблеме, позволяющий определить пути, способные привести к успешному объяснению. Такой процесс доработки исследовательской проблемы через осуществление обоснованного выбора и носит название формулирования теории. [c.28]

ОПЕРАЦИОНАЛИЗАЦИЯ ТЕОРИИ

Получив в распоряжение одну или несколько исследовательских проблем и теорию, которой следует руководствоваться в процессе поиска ответов, мы должны перейти к следующему этапу – этапу операционализации. Под операционализацией понимается преобразование, или переформулировка, наших относительно абстрактных теоретических понятий в конкретные термины, которые позволят нам действительно измерить то, что мы хотим. Операционализация предполагает переход от концептуального уровня (обдумывания проблемы) к операциональному (разработке путей ее решения). Человек при этом учится думать в практических терминах. [c.28]

Возвращаясь к нашему примеру, предположим, что у нас имеется гипотеза (т. е. сформулирован ожидаемый ответ на вопрос, поставленный в исследовании), что на предстоящих президентских выборах жители Малой Америки, имеющие более высокий СЭС (владельцы предприятий), с большей вероятностью будут голосовать за кандидата республиканской партии, чем жители с более низким СЭС (служащие). Это согласуется с результатами бесчисленных исследований по проблеме голосования, и, кроме того, такое предположение представляется вполне обоснованным и для данного случая. Однако как выяснить это наверняка? Нельзя же просто подойти к жителю города и сказать: “Добрый вечер! Какой у вас социально-экономический статус: более высокий или менее высокий?” Начать с того, что человек, которого мы интервьюируем, возможно, просто не поймет, о чем идет речь, поскольку социально-экономический статус – очень специальный термин, имеющий множество оттенков значения. И во-вторых, даже если мы получим ответ, мы, возможно, не сможем его интерпретировать. Предположим, что респондент ответил: “У меня более высокий социально-экономический статус”. Более высокий, чем у кого? Насколько высокий? Каким образом этот человек определяет социально-экономический статус? Имеют ли респондент и исследователь в виду одно и то же? Рассуждая об абстрактном понятии, мы должны найти способ более эксплицитно определить, как мы его понимаем; затем мы должны максимально однозначно выразить свое определение в виде вопроса или измерения.

Трудность при этом заключается в том, чтобы осуществить разумный и вместе с тем случайный выбор среди многочисленных оттенков значения. Что мы имеем в виду, используя переменную СЭС: уровень дохода респондентов, их род занятий или, быть может, даже их субъективные представления о том, к какому социальному классу они принадлежат? Любая из этих характеристик могла бы быть компонентом СЭС, однако у каждой из них свое особое значение, и измеряться они должны по-разному:

каким был суммарный доход Вашей семьи в прошлом году? Чем Вы занимаетесь? К какому классу Вы бы себя отнесли: к классу рядовых работников, к среднему классу или к высшему классу? [c.29]

Иными словами, сформулировав некую гипотезу или проблему исследования, мы должны очень внимательно изучить, что же имеется в виду под каждой используемой нами формулировкой, и попытаться более точно определить и перевести ее на язык измеряемых показателей. В сущности, мы пытаемся найти наименьший общий знаменатель для некоторого значения. (Например, хотя не все придадут одно и то же значение термину социально-экономический статус, почти все одинаково воспримут его через годовой доход в долларах.) В ходе этого процесса сужаются используемые нами понятия и исчезают оттенки значения, однако именно поэтому наши рассуждения становятся более точными и существенно возрастают возможности изложить полученные результаты ясно и недвусмысленно. Такой процесс перевода и упрощения, который мы называем операционализацией, – единственно верный способ провести осмысленное исследование. [c.30]

ВЫБОР АДЕКВАТНЫХ МЕТОДОВ ИССЛЕДОВАНИЯ

Решив, что мы хотим измерять, мы должны решить, как это делать. Нужно разработать стратегию исследования, план наступления. Основную роль здесь играют два соображения. Во-первых, следует выбрать метод или сочетание методов, которые позволили бы задать те конкретные вопросы (измерить конкретные переменные), которые нас интересуют, и сделать это необходимо в соответствии с процедурой операционализации. Нельзя, например, исследовать позиции отдельных избирателей, анализируя содержание газетных сообщений в данном избирательном округе, поскольку содержание газет может выражать взгляды редактора или тех немногих читателей, чьи письма к редактору были опубликованы, не обязательно отражая при этом взгляды большинства избирателей. Кроме того, анализ содержания новостей или редакционных статей не позволяет провести разграничение между разными типами избирателей, например избирателями с более высоким и более низким СЭС. Таким образом, контент-анализ не дал бы нам возможности решить интересующую нас проблему, т. е. проверить нашу гипотезу; выборочное исследование в этом случае было бы гораздо [c.30] полезнее. С другой стороны, представим себе, что мы хотим оценить, как некая газета освещает политическую кампанию. Мы могли бы просто проанализировать содержание самой газеты, подсчитывая количество упоминаний тех или иных кандидатов; либо мы могли бы обследовать читателей газеты, чтобы определить, что именно из прочитанного о кампании им запомнилось. В первом случае мы располагали бы непосредственным измерением содержания, из которого следует сделать выводы о воздействии прессы, во втором – непосредственным измерением воздействия, из которого следует сделать выводы о ее содержании. В зависимости от точной формулировки проблемы исследования полезными могут оказаться та или иная стратегия или их сочетание. Таким образом, приемлемость данного метода исследования в значительной степени определяется тем, какую именно проблему мы взялись изучать.

Однако есть еще и второе соображение, которое можно было бы определить как возможность реализации. В процессе исследования возникает момент, когда мы готовы покинуть нашу “башню из слоновой кости” и обратиться к реальной действительности. Поэтому мы должны быть уверены, что избранный нами метод или прием может быть успешно применен в тех конкретных условиях, с которыми нам предстоит иметь дело. Например, поскольку в нашей Малой Америке нет газеты (а есть, как мы помним, только станции обслуживания и рестораны), мы не можем, даже если бы захотели, воспользоваться контент-анализом. Точно так же самый простой способ измерить уровень отношений между руководством Ирака и Турции – провести ряд личных интервью, однако организовать интервью с руководителями этих стран весьма затруднительно, если не сказать больше. В каждом конкретном случае нам приходится подбирать далеко не идеальные способы измерения ключевых переменных. Таким образом, подходящий метод – это метод, максимально эффективный в условиях ограничений, накладываемых ситуацией исследования.

В итоге нужно найти способ измерения переменных, которые мы хотим измерять: (1) соответствующий нашим рабочим определениям переменных и (2) практически осуществимый. Мы должны, насколько это возможно, [c.31] соблюдать принятые в науке требования, однако мы можем соблюдать их лишь в той степени, в какой позволяют обстоятельства. [c.32]

НАБЛЮДЕНИЕ ЗА ПОВЕДЕНИЕМ

На четвертом этапе процесса исследования реально осуществляется стратегия исследования, разработанная на третьем этапе. Здесь должны приниматься во внимание многие факторы, однако два из них заслуживают особого упоминания. Во-первых, генерализуемость, во-вторых, реактивность.

Генерализуемость означает возможность с определенной степенью надежности распространять или переносить наши выводы, основанные на наблюдении за поведением людей в нескольких частных случаях, на предполагаемое поведение всей совокупности. Мы должны учитывать это при отборе конкретных объектов (людей, решений, организаций или наций), которые мы собираемся изучать. Проблема, которая здесь возникает, – это в основном проблема степени распространения. Если событие повторяется всего 4-5 раз или в группе, которую мы хотим изучать, имеется всего 4-5 объектов, то мы можем рассмотреть каждое из этих событий или каждый из этих объектов индивидуально и сделать относительно них разнообразные обобщающие утверждения, будучи в достаточной степени уверенными, что наши выводы распространяются на все объекты. Однако, что бывает гораздо чаще, если число объектов достигает многих сотен, тысяч или даже миллионов, так что рассмотреть каждый из них непосредственно нет никакой возможности, мы будем намного меньше уверены в том, что исследование относительно небольшого числа объектов (возможно, менее чем одного из тысячи) позволит нам сделать правильные выводы относительно всей группы. В этих условиях мы должны разработать стратегию, часто называемую процедурой формирования выборки, с помощью которой можно решить, каковы те немногие представители огромного множества объектов, изучив которые мы получим выводы, применимые ко всей совокупности. При этом мы должны решить, сколько объектов нужно изучить и как следует их отбирать, а также попытаться оценить репрезентативность этих нескольких объектов. Залогом генерализуемости служит выбор для наблюдения тех объектов, которые, по всей вероятности, наилучшим [c.32] образом представляют генеральную совокупность, являются ее наиболее типичными представителями.

Отобрав объекты для анализа, мы должны проявить максимум внимания при их изучении. Следует избегать таких способов измерения политических явлений или поведения, которые являются реактивными. Реактивность подразумевает одну из двух возможностей: либо тот, кто проводит исследование, либо методы исследования могут каким-то образом воздействовать на тех, за кем ведется наблюдение, и вносить в их действия изменения, обусловленные именно присутствием исследователя. Иными словами, существует опасность, что сама по себе процедура исследования может изменить поведение тех, кто подвергается изучению, так что конечные результаты окажутся ошибочными. По-видимому, в качестве классического примера реактивности можно привести исследование, проводившееся в 1939 г. на одной из фабрик, в ходе которого изучалось влияние изменения условий труда на производительность рабочих. На протяжении более чем одного года для небольшой группы рабочих меняли продолжительность рабочего дня, периодичность перерывов, освещение, способ оплаты. Однако вне зависимости от условий, в которых работала группа, будь то длинный или короткий рабочий день, редкие или частые перерывы и т. п., члены этой группы постоянно превосходили по производительности труда всех других рабочих той же самой фабрики. Оказалось, что наиболее значимым фактором, повлиявшим на производительность труда, был необычайно высокий моральный подъем, связанный с тем, что члены данной группы ощущали себя объектом внимания и участниками эксперимента³. Данный эффект, так называемый эффект Готорна (по названию фабрики, где он впервые был отмечен), означал, что никаких выводов относительно связи между условиями труда и производительностью труда нельзя было делать потому, что процедура наблюдения создавала неестественную обстановку, непохожую на обычные условия работы.

Проводя политологическое исследование, мы иногда сталкиваемся с очевидными примерами реактивности, напоминающими рассмотренный случай. Самоуверенность или недружелюбие интервьюирующего, наводящий вопрос или назойливость наблюдателя могут настолько [c.33] исказить изучаемую ситуацию, что результаты исследования не будут вызывать никакого доверия. Примерно в половине случаев, однако, воздействие таких факторов более скрыто. Например, можно было бы соответствующим образом обучить очень хорошего интервьюера, так чтобы он задал абсолютно безупречный (и тем не менее оказывающийся реактивным) вопрос: “Вы одобряете экономическую политику президента?” Возможно, последует ответ: “Одобряю. Идея представляется мне хорошей”. Однако можем ли мы быть уверены в том, что респондент действительно имел какое-то мнение относительно экономической политики президента до того, как его об этом спросили? Разве не может само интервью послужить катализатором, способствуя формированию мнения респондента и возникновению оценки, которой ранее не существовало. Это тоже реактивность, однако реактивность такого типа гораздо труднее обнаружить и предотвратить.

Совершенно недостаточно просто выйти на поле боя, вооружившись несколькими вопросами, и начать искать ответы на них. Необходимо как следует позаботиться о том, как и где выйти на это поле, как и кого обследовать. Если небрежно провести обследование, можно погубить лучшую теорию и лучший план наступления. [c.34]

АНАЛИЗ ДАННЫХ

Элементы информации о каждом объекте, которые мы собираем в процессе исследования, называются данными, и, как только они получены, перед нами начинает маячить конец работы. Наша цель на этом этапе – уяснить, что именно мы получили для решения проблемы исследования. Имеется ли какая-либо связь между поведением, которое мы надеемся объяснить или лучше понять, с одной стороны, и факторами, которые, как мы думаем, помогут нам сделать это, – с другой? Предположим, например, что, по нашим расчетам, люди, различающиеся уровнем образования, будут систематически различаться по степени вероятности участия в голосовании. Во многих случаях это можно сделать, ответив на три вопроса. Наш первый вопрос: так ли это? Действительно ли люди, отличающиеся друг от друга по одной из этих переменных, будут последовательно различаться и по другой? Будут ли более образованные люди последовательно отличаться от менее [c.34] образованных большей или меньшей склонностью принимать участие в голосовании? Анализируя полученные данные, мы могли бы, например, выяснить, что менее образованные люд и принимают участие в голосовании почти столь же часто, как и более образованные, что знание уровня образования не дает возможности ни предсказать, ни объяснить, почему вероятность участия в голосовании для данного человека отличается от вероятности участия для кого-то другого. Если это так, то мы заявляем, что уровень образования не оказывает влияния на вероятность голосования или, иначе говоря, что между этими двумя переменными нет никакой связи. Таким образом, анализ не подтверждает наши ожидания. С другой стороны, если мы обнаружим, что в шести или семи случаях из десяти знание уровня образования позволяет точно предсказать, примет ли данный человек участие в голосовании, мы получим данные в поддержку нашего утверждения о связи этих двух переменных. Следовательно, мы выясняем, что, когда речь идет о голосовании, более образованные люди систематически отличаются от менее образованных, и получаем возможность понять поведение при голосовании объектов нашего исследования. Итак, основное, что необходимо выяснить при оценке гипотезы, – это наличие между двумя переменными статистической зависимости.

Как только эта связь установлена, необходимо задать не менее важный вопрос: как связаны эти две переменные? Будут ли более образованные люди участвовать в голосовании с большей вероятностью, чем менее образованные? Или же связь между этими переменными носит еще более сложный характер? Если мы продумали нашу гипотезу и в результате можно предполагать, что уровень образования связан с голосованием, мы, вероятно, имеем в виду одну из этих возможностей.

Например, можно было бы утверждать, что при наличии более высокого уровня образования возрастает вероятность наличия у человека навыков и знаний, необходимых для того, чтобы поддерживать у него интерес к политике. Соответственно, более образованный человек скорее примет участие в голосовании, чем тот, кто обладает меньшими навыками или располагает меньшей информацией. Таким образом, мы вправе ожидать, что участие в голосовании будет более [c.35] частым или более типичным для тех исследуемых нами людей, чей уровень образования выше. Этот тип соотношения иллюстрируется на рис.1.1а (точки на прямой представляют соответствующие значения переменных).

Рис. 1.1. Соотношение между уровнем образования и вероятностью голосования

Однако мы могли бы также считать, что, чем образованнее становится человек, тем сильнее он разочаровывается в политической деятельности. В соответствии с этой точкой зрения образованность ведет к разочарованию, что в свою очередь уменьшает желание принимать участие в голосовании. В этом случае мы можем ожидать, что чаще голосовать будут менее образованные из обследуемых нами людей. Этот тип соотношения иллюстрируется на рис.1.1б.

Наконец, мы могли бы даже утверждать, что образование лишь до определенной степени увеличивает возможности для занятий политикой и интерес к ней, тогда как люди с более высоким уровнем образования (например, обучающиеся в колледже) гораздо сильнее разочарованы в политике и потеряли к ней интерес. В этом случае мы можем ожидать, что наиболее часто будут голосовать люди, имеющие средний уровень образования, в то время как на полюсах степень участия в голосовании будет ниже. Это более сложное соотношение иллюстрируется на рис.1.1в.

В каждом из случаев между уровнем образования человека и вероятностью его участия в голосовании имеется определенная зависимость, однако совершенно очевидно, что следствия, вытекающие из этих разных соотношений, совершенно различны. Таким образом, мы можем [c.36] обнаружить сильную взаимозависимость между двумя переменными и тем не менее оказаться не в состоянии подтвердить свою гипотезу.

Нужно задать себе и третий, возможно, менее очевидный вопрос. Насколько вероятно, что то или иное соотношение, обнаруженное нами при исследовании небольшого числа объектов, будет также получено при исследовании всей той совокупности, из которой выбирались эти объекты? Если угодно, это сформулированный в статистической форме вопрос о том, насколько обоснованно наше утверждение, что небольшая выборка репрезентативна, или типична, для генеральной совокупности. Если, выбирая для исследования конкретные объекты, мы принимали правильные решения, можно с уверенностью утверждать, что наши выводы, хотя и основаны на нескольких объектах, применимы ко всем объектам без исключения. Если мы ошибались, степень нашей уверенности может быть теперь не столь высокой. К сожалению, как станет яснее из последующих глав, когда выводы основаны на выборке из совокупности, никогда нельзя доверять им полностью. [c.37]

ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ

Наконец наступает момент, когда мы должны составить из отдельных фрагментов единую картину. Насколько мы преуспели в том, чтобы сформулировать именно ту проблему исследования, которую хотели? Что мы обнаружили? Каково значение наших результатов? Как соотносятся эти результаты с нашими ожиданиями? В сущности, к данному моменту мы свели некоторый аспект политического поведения к множеству цифр, которые могут отражать, а могут и не отражать статистические соотношения. Мы должны понять, каков вклад любых таких соотношений, а также других фактов, которые мы выяснили по ходу дела, в решение нашей проблемы исследования. Но и это еще не все, поскольку нам следует также критически взглянуть на само наше исследование. Не совершили ли мы в процессе исследования какой-нибудь существенной ошибки, которая могла бы обесценить полученные результаты? Удалось ли нам сохранить тесную связь между теорией и исследованием, с одной стороны, и [c.37] реальной политической деятельностью – с другой? Не следует ли отнести некоторые очевидные вещи, имеющие отношение к реальному миру, за счет того, что мы сделали (либо не смогли сделать) в процессе исследования, а не за счет реальных событий? На эти вопросы трудно ответить, однако истинный ученый всегда пытается это сделать, поскольку лишь наличие таких ответов позволяет понять, в какой степени можно доверять результатам исследования.

Этот краткий обзор шести этапов исследовательского процесса должен дать хорошее представление о том, что такое научное изучение политики, и о том, чему посвящена настоящая книга. Немало места в книге будет уделено тому, чтобы найти подходы к решению и оценке каждой из этих задач. Мы, конечно, понимаем, что большинство из тех, кто читает эти страницы, никогда не станут учеными-политологами. Но мы также знаем, что навыки, необходимые для проведения исследований высокого уровня, могут с не меньшим успехом применяться для выработки более четкого и более критичного подхода к чтению и оценке работ, выполненных другими, а этим умением должен владеть каждый, кому не чужд интерес к изучению политики. Социологические исследования все более широко используются в качестве основы при определении социальной политики и принятии законодательных решений. Именно поэтому становится все более и более важным, чтобы граждане могли оценивать качество проводимых исследований, с тем чтобы выполнять свои обязанности в демократическом обществе.

Выводы.

Совокупность знаний, которую мы называем политологией, не есть нечто незыблемое, врученное нам в виде каменных скрижалей еще в античные времена. Эти знания постоянно расширяются, изменяются и уточняются. Каждое исследование заключает в себе возможность расширения наших знаний, нашего понимания. Однако эта возможность становится осуществимой лишь тогда, когда само исследование сможет удовлетворять критическим требованиям, лишь тогда, когда оно будет отвечать общепринятым стандартам. Эти стандарты и составляют содержание настоящей книги, и изучение их (как в целях осуществления своих собственных исследований, так и в [c.38] целях критического осмысления прочитанного) даст вам основы для понимания того, что уже сделано в области политологии, и для внесения своего собственного вклада в эту науку. [c.39]

2-лекция. СОЗДАНИЕ ТЕОРИИ: ПОНЯТИЯ И ГИПОТЕЗЫ В ПОЛИТОЛОГИИ

Политические проблемы всегда сложны. Приведут ли судебные постановления, направленные на расовую десегрегацию муниципальных школ, к установлению расового равенства или усилят расовые различия, поощряя “белое вторжение” в сегрегированные пригороды? Если Конгресс уменьшит федеральный подоходный налог, будет ли при этом получено достаточное количество средств для сокращения безработицы или это приведет лишь к большей инфляции? Мы проводим социологические исследования для понимания окружающего нас сложного мира: либо для того, чтобы удовлетворить нашу потребность в знаниях, либо для того, чтобы быть и состоянии предвидеть будущие события или даже управлять ими.

Таким образом, научное исследование начинается с потребности что-то узнать. Это то, что мы назвали проблемой исследования. Обычно проблема исследования носит очень общий характер. Например, мы могли бы задаться вопросом, почему некоторые люди принимают активное участие в защите окружающей среды, тогда как другие выступают против этого движения или просто не интересуются им. Наиболее эффективный способ найти точный и потому полезный ответ на этот вопрос состоит в том, чтобы применить существующие методы эмпирического исследования отношений, наблюдаемых нами в мире. Прежде чем мы сможем применить научные процедуры, пытаясь найти приемлемое для всех решение нашей проблемы, необходимо свести этот очень общий вопрос к одному или нескольким очень конкретным. Не сделав этого, мы не будем знать, за чем именно следует наблюдать при поиске решения, и не поймем, как связаны наблюдаемые факты с исследуемой проблемой.

Превращение общей проблемы исследования в одну или несколько конкретных требует разработки возможных объяснений наблюдаемых фактов. Например, мы могли бы считать, что позиция людей в отношении защиты окружающей среды определяется характером их работы. Так, для некоторых профессий меры по защите [c.40] окружающей среды оказываются полезными, тогда как другим они наносят ущерб (по крайней мере на первых порах). Можно было бы решить, что на отношении людей к экологии сказывается возраст, поскольку более молодое поколение воспитывалось в то время, когда проблемы загрязнения окружающей среды были уже осознаны, тогда как люди более старшего поколения выросли до того, как эти проблемы были замечены.

Такого рода объяснения позволяют нам уменьшить степень сложности общественных явлений и приступить к научному исследованию. Мы можем использовать уже известную нам логику эмпирических взаимосвязей и имеющуюся информацию о них, для того чтобы продумать до конца ряд положений, которые, как мы ожидаем, будут идентичными. Теперь мы можем задать вопросы типа: правда ли, что более молодые люди чаще выступают в защиту законов об окружающей среде, чем это делают более пожилые? Правда ли, что “белые воротнички” и лица свободных профессий чаще, чем “синие воротнички”, поддерживают мероприятия в защиту окружающей среды? Можно разработать способы наблюдения, которые позволили бы нам ответить на эти вопросы, и, когда достаточно мелкие вопросы будут исследованы, мы сможем в конце концов решить первоначально поставленную проблему.

Пытаясь дать возможные объяснения событиям, мы теоретизируем, или строим теории. Теории создаются при попытке достичь понимания. Они помогают направлять нашу работу и определять, правильно ли наше понимание проблемы. Именно поэтому создание теории является первым шагом исследовательского процесса, и именно поэтому важно понимать взаимоотношения между теорией и самим исследованием.

Неподходящая теория может привести к тому, что наш труд окажется бесполезным для решения заинтересовавшей нас вначале проблемы. Не располагая надежной теорией, мы не сможем объяснить, почему наши результаты дают ответ на поставленный вопрос. Предположим, что мы начинаем исследование, имея в своем распоряжении только тот общий вопрос, который был сформулирован выше. Если должным образом сформированной выборке, состоящей из 1500 американцев, задавать вопросы об их [c.41] отношении к защите окружающей среды вместе с выяснением их характеристик, то полученные результаты можно будет использовать для описания типов людей, поддерживающих законодательную деятельность по охране окружающей среды или выступающих против нее, однако объяснить, почему они поддерживают ее или выступают против, мы не сможем.

С другой стороны, если мы начнем с теории, которая дает объяснение того, почему люди выступают в поддержку или против политики охраны окружающей среды, и зададим наши вопросы с целью проверить правильность ожиданий, логически вытекающих из этой теории, полученные результаты будут способствовать пониманию того, почему люди занимают именно ту позицию, которую они занимают.

Предположим для простоты, что, согласно нашей теории, первая забота всех людей – материальное благополучие и что их позиция по вопросам защиты окружающей среды полностью определяется тем, как, по их мнению, предлагаемые законы повлияют на их доходы. Возможное ожидание, или прогноз, логически вытекающий из такого рода рассуждений, состоит в том, что люди, которые думают, что введение законов по охране окружающей среды нанесет им материальный ущерб, будут выступать против этих законов, а те, кто предполагает благоприятное воздействие законов, поддержат их. Если наша теория является адекватным объяснением того, как люди вырабатывают свою позицию по вопросу защиты окружающей среды, то данный прогноз должен быть верным. Можно получить некоторое представление о пользе теории, проверив эмпирическую правильность прогнозов, логически из нее следующих. Например, мы могли бы спросить людей об их позиции по вопросу защиты окружающей среды и о том, как, по их мнению, эти проблемы связаны с их доходами, для того чтобы выяснить, подтверждается ли наш прогноз имеющимися у нас знаниями о реальных отношениях. Вне зависимости от полученного результата наше исследование может сообщить нам некоторые сведения о том, почему люди воспринимают эту проблему так, а не иначе. Если исследование проведено корректно и прогноз подтверждается, мы можем с определенной степенью уверенности считать, что получили надежное объяснение [c.42] обсуждаемых фактов, и искать дополнительные аргументы в пользу пригодности этого объяснения. Если прогноз оказывается неверным, мы по крайней мере можем считать, что данная теория не годится для понимания позиции людей в данном вопросе, и можем обратиться к поиску других возможных объяснений.

Вне зависимости от того, располагаем мы или нет вначале какой-либо теорией, в ходе исследования могут быть получены одни и те же факты. Однако продвинуться в понимании проблемы помогут лишь факты, которые мы в состоянии связать друг с другом посредством теории. Знание того, что “белые воротнички” чаще, чем “синие воротнички”, выступают в защиту окружающей среды, будет служить объяснением того, почему люди занимают ту или иную позицию, лишь тогда, когда мы можем как-то обосновать связь между родом занятий и позицией по проблемам экологии. В противном случае все это может оказаться случайным совпадением, и знание данного факта никак не поможет нам объяснить наличие у человека той или иной позиции. Теории помогают объяснять, почему факты должны быть связаны так, а не иначе, и дают возможность интерпретировать факты в определенных рамках и установить связи между ними.

Цель данной главы – показать, как разрабатываются теории и как они влияют на проведение исследований. Мы обсудим специфику теорий в области социальных наук, элементы таких теорий и соотношение теории с остальной частью процесса исследования. Прочитав эту главу, читатель будет в состоянии осмыслить интересующие его политические проблемы в такой степени, чтобы провести систематическое эмпирическое исследование и найти эффективные (если не полные) решения этих проблем. [c.43]

ЧТО ТАКОЕ ТЕОРИЯ?

Теории создаются по двум причинам. Во-первых, мы надеемся с помощью теорий так упростить действительность, чтобы можно было как-то понять ее и тем самым контролировать либо приспосабливаться к ней. Во-вторых, после того как понимание действительности достигнуто, теории могут послужить руководством для проверки его правильности. Теории логически обосновывают ожидания, или прогнозы, относительно реального мира, [c.43] которые посредством соответствующих методов исследования могут сопоставляться с действительностью. Когда прогнозы подтверждаются, получают подтверждение и те рассуждения, которые лежат в их основе, соответственно возрастает наша уверенность, что мы правильно уловили ход событий. Когда наши прогнозы оказываются неверными, мы начинаем сомневаться в своем понимании и ищем способы достичь правильного понимания событий.

Теории представляют собой множества логически связанных символов, отражающих то, что, по нашему мнению, происходит в мире. Теории всего лишь интеллектуальные инструменты. Это очень важно усвоить, поскольку таким образом мы получаем возможность осознать, что теории ни в каком абсолютном смысле не являются ни истинными, ни ложными, а только более или менее полезными. Точно так же, как существует несколько способов изготовить молоток, существует и множество путей разработки теорий, объясняющих политическую жизнь. Таким образом, бессмысленно ожидать, что теорию можно открыть подобно тому, как мореплаватель открывает неизвестный остров. Почему? Да потому, что теории не существуют “во внешнем мире”, так чтобы их можно было открыть. Они – создание человеческого воображения, тяжелого труда и иногда счастливого случая.

Если теории столь необходимы для проведения добротного исследования и в то же время их нельзя обнаружить путем простого разглядывания на протяжении многих часов груды распечаток, то как же взяться за построение теории, которая бы вела к пониманию интересующих нас аспектов политической жизни? Какие процессы здесь задействованы? Ответ не совсем ясен и прост, поскольку теории строятся самыми разными способами. Мы не можем предъявить набор процедур для создания конструктивной теории так, как могли бы описать изготовление стереосистемы. Однако мы можем пояснить главные идеи, лежащие в основе процесса создания теорий, и наиболее важные этапы этого процесса. Первый из них – концептуализация проблемы. [с.44]

ЛОГИКА ПОСТРОЕНИЯ ТЕОРИИ

Начав с события или поведения, которое мы хотим понять, мы должны прежде всего спросить себя, какие из [с.44] имеющихся знаний о явлении могли бы помочь объяснить его. Понимание достигается на основе собственного опыта, случайного наблюдения или творческого размышления. Еще чаще полезным становится систематическое изучение чужих достижений в данной области. Полезные теории начинают свое существование с досконального изучения тех событий, которые мы хотим объяснить. Без такого рода знаний мы можем оказаться не в состоянии понять, что же следует объяснять, или не будем располагать указаниями о том, где искать реальные отношения, которые можно использовать для объяснения событий.

Массовые волнения, происходившие во многих городах США в конце 60-х годов, дают пример того, что знание фактов очень важно для правильной концептуализации проблемы исследования. Когда волнения только начались, многие официальные лица называли их выступлениями групп бедняков, не имеющих устойчивых связей с обществом. Если бы мы приняли такую интерпретацию и попытались проанализировать эти волнения, стоящую перед нами задачу можно было бы сформулировать следующим образом: почему в американских городах сконцентрировалось так много “отбросов общества” и каким образом были спровоцированы выступления? Многие официальные лица приводили в качестве объяснения присутствие якобы каких-то посторонних агитаторов. Однако, когда социологи провели интервью в городах, где происходили волнения, оказалось, что участниками волнений были не только “отбросы общества”. Фактически состав участников волнений почти не отличался от состава негритянского населения этих городов¹. В свете этого факта задача нашего исследования становится в корне отличной от той, которая диктовалась интерпретацией событий как обусловленные участием в них “отбросов общества”. В этом случае мы должны попытаться понять, что побудило обычных граждан негритянского происхождения, имеющих ту или иную работу, семью и другие общественные связи, принять участие в волнениях. Соответствующие объяснения опираются скорее на такие переменные, как реакция негритянского населения на расизм белых, чем присутствие посторонних агитаторов.

В данном примере неадекватные знания о фактах могли направить наши действия по созданию теории в [с.45] совершенно неверном направлении. Вот почему столь важным является поисковое исследование, цель которого – установление соответствующих фактов. По этой же причине (если мы хотим строить надежные теории) необходимо искать информацию об исследуемых явлениях в литературе.

И все-таки как именно строится теория, объясняющая наблюдаемые явления, после того как все доступные факты оказываются в нашем распоряжении? Обычно мы начинаем с поиска фактов для тех моделей, которые могут объяснить наблюдаемые события.

Например, мы хотим узнать, каковы были причины политических выступлений в университетских городках. Чтобы ответить на этот вопрос, необходимо объяснить, что заставило студентов участвовать в этих выступлениях. Если бы мы сами были участниками таких выступлений или знали кого-либо из участников, у нас могли бы возникнуть некоторые соображения относительно побудительных мотивов выступлений, однако объяснение того, почему в них участвовали большие массы студентов, потребовало бы информации о гораздо большем числе людей. Чтобы дать такое объяснение, гораздо разумнее было бы собрать данные о характеристиках и мотивах выступлений, общих для всех участвовавших в них студентов. Если среди участников обнаружились общие свойства, отличающие их от остальных студентов, мы можем заключить, что именно они и приводят к участию в демонстрациях. При этом особая роль таких характеристик становится частью объяснения того, почему происходят выступления.

Переход от обобщения того, что мы наблюдаем, к тому, . чего мы не наблюдаем или не можем наблюдать, называется индукцией. Индукция составляет базис научной теории. Теории, построенные на основании наблюдений с помощью индукции, называются эмпирически обоснованными. В процессе индукции, исходя из наших знаний о некоторых ситуациях, мы делаем вывод о том, как могли бы обстоять дела в других, сходных ситуациях. Мы делаем логический скачок от того, что видели, к прогнозу относительно того, чего не видели, базируясь на предположении, что в основе всех событий реального мира лежит некая постоянная глубинная модель. В своей повседневной жизни [с.46] мы все пользуемся индукцией. Если пять раз подряд мы наблюдаем, что после нажатия кнопки на стене дверь лифта открывается, мы быстро сделаем из этого вывод, что нажатие кнопки вызывает открывание двери. Здесь имеет место индуктивное обобщение – переход от нескольких случаев, которые мы наблюдали (пятикратное нажатие кнопки), к случаям, которые мы не наблюдали (нажатие кнопки большее число раз и нажатие кнопок лифтов в других зданиях). Процесс индукции изображен на рис.2.1а. На диаграмме изображено, как именно основываются на фактах индуктивно построенные теории.

Однако для создания теории нужна не только индукция, поскольку отсылка к фактам еще не дает объяснения, если только мы не в состоянии показать, почему эти факты приводят к наблюдаемым результатам. Вернемся к примеру со студенческими выступлениями. Предположим, мы обнаруживаем, что их участники, как правило, были в большей степени недовольны государственной политикой, чем те, кто не принимал в них участия, и что они, кроме того, в гораздо меньшей степени верили в эффективность обычных способов достижения политических изменений. Установление этого факта служит объяснением причины выступлений только в том случае, если мы можем показать, почему подобная ситуация должна вести к выступлениям. Чтобы продемонстрировать это, вероятно, понадобится сделать ряд предположений о политическом поведении, а точнее, окажется необходимым сделать прогноз о том, что для изменения политики, с которой люди не согласны, они будут предпринимать определенные действия и что, не видя никаких изменений в политике под воздействием обычных политических методов (голосование, написание писем и т. п.), они перейдут к открытым выступлениям.

В последующем эти предположения (называемые иногда аксиомами или постулатами) входят в состав нашей теории. Они описывают условия, при которых в соответствии с нашими ожиданиями полученные нами предварительные объяснения подтверждаются имеющимися данными. Делая общие утверждения о политическом поведении в определенных условиях, эти положения объясняют, почему мы ожидаем студенческих выступлений, опираясь на то, что мы знаем о студентах университетских [с.47] городков. Теперь мы можем объяснить конкретный способ поведения (выступление), показав, что он логически вытекает из ряда теоретических предположений.

Поступая таким образом, мы совершаем действие, обратное тому, которое совершали при индуктивном рассуждении. Здесь мы движемся от абстрактных утверждений, касающихся общих взаимосвязей, к конкретным утверждениям, касающимся специфических типов поведения. Этот процесс рассуждения от абстрактного и общего к конкретному и специфическому известен под названием дедукции. Мы все пользуемся дедуктивной логикой в повседневной жизни. Если мы предполагаем, что работа лифтов управляется системой настенных кнопок, и оказываемся перед лифтом, мы обычно делаем вывод, что для попадания в лифт необходимо нажать имеющуюся кнопку. От обобщения мы перешли здесь к прогнозу относительно конкретного события с помощью дедукции. Этот процесс изображен на рис.2.1б.

Дедукция -это процесс, позволяющий нам использовать теории для объяснения событий реального мира. Если с помощью процесса дедукции мы в состоянии продемонстрировать, что некоторое наблюдаемое событие может быть логически предсказано на основе ряда предположений, входящих в нашу теорию, то тем самым теория дает объяснение наблюдаемому явлению. Теория помогает понять событие, обосновывая, почему оно именно такое, какое оно есть. Дедукция предназначена для осуществления связи между теорией и нашими наблюдениями.

Однако сама по себе разработка теории еще не делает ее эффективной. Обычно мы подходим к объяснению некоторого события, располагая многими теориями. В таком случае необходимо задать вопрос, какие из этих теорий больше всего помогают нам в понимании действительности. Ответ на этот вопрос требует проверки альтернативных теорий фактами действительности. Прежде чем обсуждать проверку теорий, необходимо понять две вещи. Во-первых, для того чтобы заниматься созданием теорий, надо выяснить, что определяет полезность теории. Во-вторых, нам следует выяснить, как компоненты теории связаны друг с другом и с эмпирическими исследованиями. Чтобы быть полезной для объяснения наблюдений, теория должна отвечать следующим требованиям: [с.49]

1. Теория должна быть верифицируемой. Можно ли, исходя из теории, сделать прогнозы относительно действительности, достаточно конкретные и специфические, так чтобы мы могли провести наблюдения, либо подтверждающие, либо опровергающие их? Может ли теория быть связана с действительностью систематическим образом или она представляет собой всего лишь множество абстракций?

2. Теория должна быть логически непротиворечивой. Является ли теория внутренне последовательной? Являются ли ее предположения совместимыми друг с другом, а входящие в нее термины – однозначными?

3.Теория должна быть доступной. Могут ли другие, должным образом обученные люди понять теорию так, чтобы иметь возможность использовать ее для объяснения событий и заниматься проверкой вытекающих из нее гипотез?

4. Теория должна быть общей. Можно ли использовать ее для объяснения разнообразных событий, происходящих в разных местах и в разное время? Можно ли, основываясь на ней, строить прогнозы, которые легко проверить при различных условиях, или она жестко привязана к одному виду наблюдений?

5. Теория должна быть экономичной. Достаточно ли она проста, чтобы быть легко применимой и понятной, или она столь сложна, столь переполнена условиями и исключениями, что эксплицитные ожидания о событиях реальной действительности извлекаются из нее с трудом?

Теории могут обладать этими желательными характеристиками в разной степени, и иногда при разработке конкретной теории нам приходится отдавать предпочтение одним характеристикам в ущерб другим. Мы, например, можем поступиться экономичностью в пользу большей общности или верифицируемости. Чтобы результаты нашего труда действительно приносили пользу, мы должны, формулируя теории, иметь в виду все перечисленные выше требования. [с.50]

КОМПОНЕНТЫ ТЕОРИИ

Теория состоит из множества понятий, связанных утверждениями, логически выведенными из множества предположений. Такова логическая структура теории. Именно эта структура позволяет нам использовать теорию для объяснения событий, поскольку дает [с.50] возможность обосновывать, почему мы вправе логически ожидать именно того положения дел, которое имеет место.

Поиски полезной теории начинаются с решений, которые мы принимаем относительно строительных блоков теорий – понятий. Понятие – это просто слово или символ, который обозначает некоторое представление. В понятиях нет ничего мистического. Мы пользуемся ими ежедневно, облегчая себе взаимодействие с многоплановой действительностью за счет того, что подводим под некоторую категорию встречающиеся нам объекты в соответствии с некоторыми релевантными для нас их свойствами. Четвероногих, которых мы видим, мы относим к коровам, кошкам, собакам и другим видам животных, и такая классификация сама по себе является основой для возникновения некоторых важных ожиданий (например: от собак не стоит ждать молока). Приписывая наименование тому или иному объекту, мы можем делать относительно него некоторые прогнозы, поскольку наименование представляет собой символ определенного сочетания свойств.

Той же самой цели служат социологические понятия. Они указывают свойства объектов (людей, политических систем, выборов), релевантные для конкретного исследования. Одного исследователя могут интересовать личностные характеристики человека, другого – идентификация данным человеком его партийной принадлежности, третьему наиболее интересен уровень политического отчуждения личности. Человек характеризуется всеми этими свойствами: личностными характеристиками, партийной принадлежностью, степенью отчуждения и многими другими, но лишь отдельные из них релевантны для каждого конкретного случая. Все исследователи имеют дело с одной и той же реальной действительностью, они лишь производят отбор, чтобы по-разному организовать свои наблюдения. Понятия помогают решить, какие из многочисленных свойств или признаков существенны для нашего исследования.

Дело в том, что понятия, как и теории, не живут собственной жизнью. Они – инструменты, которые мы создаем для определенных целей, и их нельзя назвать истинными или ложными, можно лишь считать их более или менее полезными. [с.51]

Что делает понятие полезным? На этот счет имеется три основных соображения.

Во-первых, постольку мы занимаемся эмпирическим исследованием, понятие, для того чтобы оно приносило пользу, должно относиться к явлениям, по крайней мере потенциально наблюдаемым. В Средние века важную роль при объяснении событий играло понятие Божьей Воли. Однако верифицировать подобные объяснения мы не можем, поскольку не в состоянии наблюдать Божью Волю, чтобы утверждать ее наличие или отсутствие в каждом данном случае. Чтобы иметь хотя бы какую-то научную ценность, понятие должно соотноситься с чем-то, что так или иначе измеряется с помощью наших обычных органов чувств.

Это не означает, что все понятия должны относиться к непосредственно наблюдаемым объектам. Ряд очень существенных для социальные наук понятий относится к свойствам, которые невозможно наблюдать непосредственно. У людей просто нет классового статуса в том смысле, в каком у них есть рыжие волосы, однако, если мы располагаем о них определенными сведениями (например, сведениями об их доходе или их специальности), мы можем сделать вывод о том, каков их классовый статус. Точно так же в государстве не бывает авторитарной или демократической политической системы в том же смысле, в каком его территория характеризуется наличием гор или пустынь, однако можно сделать вывод о степени демократичности данного государства, изучив определенные стороны его политической жизни (например, характер выборов и обеспечение гражданских свобод).

Возникает следующий вопрос: можем ли мы разработать набор процедур, использующих наши органы чувств для сбора информации, которая бы позволила нам определить наличие или отсутствие в реальном мире объекта, к которому относится понятие, или величину этого объекта? Если мы в состоянии сделать это для некоторого понятия, то, собственно говоря, это понятие имеет эмпирические референты: оно относится к тому, что можно прямо или косвенно наблюдать.

Во-вторых, понятия (помимо наличия у них эмпирических референтов) должны быть точными. Они должны относиться к одному, и только к одному, множеству [с.52] свойств некоторого явления. мы должны иметь возможность точно знать, о чем идет речь, когда для описания некоторого объекта используется некоторое понятие. Участвует ли в описании понятия социального класса раса или классовый статус полностью определяется факторами (такими, как доход к образование), к числу которых раса не относится? Учитывается ли степень неравенства в распределении материальных благ, когда политическая система государства характеризуется как демократическая или авторитарная, или же характер политической системы полностью определяется другими факторами? Точность очень важна, поскольку она указывает на то, за чем следует вести наблюдение, чтобы увидеть, как проявляется понятие в каждом конкретном случае. Только в том случае, если мы это увидим, мы сможем использовать понятие в объяснениях, имеющих эмпирические основания.

Точность помогает также идентифицировать эмпирические референты и проводить разграничения среди наблюдаемых явлений. Если степень демократичности определяется лишь наличием или отсутствием всенародных выборов официальных лиц, то демократическим государством являются и бывший Советский Союз, и Соединенные Штаты. Хотим ли мы в нашем исследовании рассматривать эти два государства как примеры одного и того же типа политической системы? Если нет, мы должны усовершенствовать используемое понятие, сделать его более точным, так чтобы в нашем исследовании можно было провести различие между этими двумя государствами.

И наконец, в-третьих, полезные понятия должны быть теоретически значимыми. Понятие теоретически значимо тогда, когда оно связано с достаточно большим числом других понятий данной теории, чтобы играть важную роль в объяснении наблюдаемых событий.

Давая гипотетическое объяснение студенческим выступлениям, мы использовали два понятия: глубину политического недовольства и оценку эффективности влияния обычной политической деятельности на изменения в политике. Эти два понятия были связаны друг с другом посредством предположений, состоящих в том, что люди будут предпринимать какие-то действия для изменения политики, вызывающей у них протест, и что, поняв бесполезность других средств воздействия, они перейдут к [с.53] от крытым выступлениям. Приняв во внимание эти предположения и обнаружив соответствующее сочетание взаимосвязей, о которых мы говорили, мы будем вынуждены ожидать открытых выступлений. Каждое из понятий здесь существенно для объяснения и связано как с теоретическими предположениями, так и со вторым понятием. Каждое понятие теоретически значимо, так как необходимо для объяснения.

Таким образом, становится очевидным, что теория определяет полезность понятий, связывая их друг с другом, так чтобы их можно было использовать в формулировках объяснений. Теория связывает понятия, устанавливая между ними определенные отношения. Эти отношения имеют форму утверждений, выведенных из наших предположений.

Утверждения обычно устанавливают между понятиями отношение одного из двух основных типов: ковариации или каузации. Ковариационные отношения указывают, что два или более понятий имеют тенденцию изменяться одновременно: когда увеличивается (уменьшается) одно, увеличивается (уменьшается) и другое. Ковариационные отношения не несут никакой информации о причинах одновременного изменения отношений. Например, можно предсказать, что в отношении ковариации находятся уровень политической информированности и вероятность участия в голосовании: когда возрастает одно, возрастает и второе. Однако что же при этом происходит? Люди с большей вероятностью будут голосовать, так как они лучше информированы? Или они заняты поисками информации, так как собираются принять участие в голосовании и хотят принять надежное решение? Или же и уровень информации, и вероятность голосования зависят от некоего третьего фактора, например интереса к политике или осознания общественного долга? Такое предположение не содержит никакой информации.

Каузальные (причинные) отношения указывают, что изменения в одном или нескольких понятиях приведут к изменениям в одном или нескольких других понятиях. Например, мы могли бы утверждать, что, чем сильнее у человека развита идентификация партийной принадлежности, тем выше вероятность того, что он (или она) примет участие в голосовании. Осознание того, что ты [с.54] являешься членом партии, может заставить человека принять участие в голосовании, однако высокая вероятность участия в голосовании не формирует идентификации партийной принадлежности.

Мы все в обыденной жизни привыкли рассуждать в терминах причины и следствия, однако, как правило, эти понятия используются нестрого. Часто бывает крайне трудно установить причины или последствия человеческих поступков: чем значительнее событие, тем более трудным может оказаться установление его причин. Что является причиной войны, общественного движения или образования новой политической партии?

Вследствие всех этих сложностей мы должны с осторожностью постулировать каузальные отношения и лишь в тех случаях, когда одновременно выполняются четыре условия. Во-первых, постулированные причина и следствие должны изменяться вместе, т.е. находиться в отношении ковариации. Во-вторых, причина должна предшествовать следствию. В-третьих, мы должны иметь возможность идентифицировать каузальную связь между предполагаемой причиной и следствием. (Это означает, что мы должны иметь возможность идентифицировать процесс, посредством которого изменения А вызывают изменения В.) В-четвертых, ковариация между явлениями причины и следствия не должна возникать из-за их одновременной соотнесенности каким-то третьим фактором.

Это последнее условие напоминает нам о проблеме мнимых отношений. Когда А и В изменяются вместе, поскольку оба они вызваны С, а в отсутствие С они совместно не изменяются, то усматриваемое нами отношение между А и В называется мнимым. Очень важно внимательно следить за предположениями, которые мы выдвигаем, пытаясь выявить возможные мнимые отношения, прежде чем включать их в теорию, посчитав результатом каузального взаимодействия. Классическим примером мнимого отношения служит следующий случай: вначале исследователь обнаруживает, что цена импортного рома и жалованье министров испытывают одновременные колебания, и затем делает вывод, что изменение цен на ром вызывает изменение министерского жалованья. Гораздо вероятнее, что и цены на ром, и жалованье министров изменяются в результате изменения общих экономических условий и общего уровня цен. Отношение между первыми [с.55] двумя переменными – это отношение ковариации, а не отношение каузации.

Важно понимать еще две особенности социальной каузации. Во-первых, одно явление может вызывать другое либо прямо, либо косвенно А может вызвать В лишь в том смысле, что будет являться причиной С, которое уже непосредственно будет вызывать В. Чтобы строить по возможности полные теории, необходимо очень внимательно следить за косвенной каузацией. Во-вторых, следует учитывать тот факт, что поведение человека обычно бывает обусловлено более чем одной причиной. При разработке теории необходимо избегать излишнего упрощения и отводить должное место в общественной жизни множественной каузации. Это означает, что любое событие может иметь несколько различных причин и что осуществление некоторого события иногда требует одновременного осуществления многих событий².

Для того чтобы справиться со всеми этими трудностями, обычно бывает полезно построить каузальную модель теории. Каузальная модель – это диаграмма, которая в явном виде задаст все отношения, принятые в теории, и, таким образом , все следствия, вытекающие из наших посылок, становятся более наглядными. На рис.2.2 представлен пример такой модели. Каждая стрелка модели изображает каузальное воздействие, а направление стрелки указывает, какая переменная в нашей теории является зависимой, а какая – независимой. В теории, изображенной на рис.2.2, утверждается, что на решение члена палаты представителей голосовать за или против законов о социальном обеспечении влияет множество как прямых, так и косвенных факторов. Так, на схеме показано, что такой фактор, как численность бедного населения в избирательном округе данного представителя, влияет на его голосование по вопросам социального обеспечения как прямо (независимо), так и косвенно – через избирательную состязательность округа и уровень старшинства представителя.

И ковариационные, и каузальные отношения могут быть как положительными, так и отрицательными. Это означает, что два приятия могут изменяться либо в одном и том же направлении, либо в противоположных. Если они изменяются в одном и том же направлении, отношение считается положительным. Положительное отношение представлено утверждением: чем сильнее относительное неравноправие национальных меньшинств в [c.56] обществе, тем выше вероятность политического насилия. Отрицательное отношение представлено утверждением: чем сильнее степень политического отчуждения, испытываемого человеком, тем ниже вероятность того, что он (или она) будет принимать участие в традиционной политической деятельности. В теории должно быть указано, какое именно отношение между понятиями (положительное [c.57] или отрицательное) нами ожидается. Эта информация может быть добавлена к каузальной диаграмме с помощью знаков плюс (+) или минус (–), приписанных каждой стрела к указывающих на то, положительным или отрицательным мыслится данное отношение. [c.58]

ПРОВЕРКА И СОВЕРШЕНСТВОВАНИЕ ТЕОРИИ

К теории никогда не следует относиться как к чему-то завершенному. Ее следует рассматривать в качестве инструмента, время от времени требующего пересмотра и постоянного совершенствования. Начинать нужно с постановки проблемы исследования, которая требует объяснения наблюдаемых событий. Мы выбираем понятия, полезные для объяснения этих событий, мы связываем эти понятия с помощью утверждений, логически выведенных из множества предположений, которые мы выбираем, чтобы обеспечить такое объяснение. Теперь мы как бы приперты к стене. Имеет ли наша конструкция какую-нибудь пользу? На первый взгляд, она объясняет то, что мы хотим понять, но можно ли это проверить? Можем ли мы испытать ее полезность, с тем чтобы не только знать степень нашей уверенности в ней, но и иметь возможность убедить в ее ценности других?

Проверка теории занимает центральное место в процессе исследования. Поскольку наши теории разрабатываются на основе фрагментов знаний о реальных отношениях, проверка теории в основном заключается в том, чтобы, используя теорию, сформулировать определенные прогнозы относительно остальных отношений, которые мы не рассматривали, и затем проверить, согласуются ли действительные наблюдения с тем, что мы ожидали увидеть. Мы не можем опираться на отношения, которые уже рассматривались, поскольку демонстрация того факта, что теория заставляет нас ожидать именно тех отношений, для объяснения которых она построена, вовсе не является проверкой теории.

Возьмем пример с лифтом. Понаблюдав за лифтами в каком-нибудь здании, мы можем быть совершенно уверены, что они в этом здании действуют в соответствии с системой настенных кнопок. Быть может, мы даже захотим обобщить наши наблюдения и придем к выводу, что так работают все лифты. Правильность этого вывода можно [c.58] проверить, лишь испытав другие лифты. Перепроверка лифтов в здании, с которого мы начинали, ничего не даст, поскольку мы уже знаем, что они реагируют на кнопки, а демонстрация того, что это так и есть, не прибавляет нам уверенности, что и с другими лифтами дело обстоит так же. Нам придется пойти в другие здания и посмотреть, как там работают лифты. Мы никогда не сможем окончательно доказать, что наша теория работы лифтов верна, поскольку никогда не сможем обследовать все на свете лифты. По мере того как выявляется все больше и больше лифтов, работающих именно таким образом, а не иначе, наша уверенность в правильности нашего обобщения будет возрастать. Если же мы не обнаружим больше ни одного лифта, приводимого в действие кнопками, мы быстро сделаем вывод, что ошиблись, перенеся свое первое наблюдение на все другие лифты.

Проверка теории в социальных науках подчиняется тем же принципам. Мы должны перейти от того, что мы наблюдали при разработке теории, к тому, чего мы не наблюдали, для того что бы выяснить, дает ли нам теория верное отражение реального мира. Предположим, например, что мы хотим построить теорию, объясняющую поведение на выборах. Мы просматриваем предшествующие исследования на эту тему и обнаруживаем, что в случае жителей США высшее образование положительно связано с участием в голосовании. Чем дольше человек учился, тем выше вероятность такого участия. Основываясь на этом наблюдении, мы включаем в нашу теорию предположение, утверждающее, что более высокий уровень образования способствует более высокой вероятности участия в голосовании. Мы знаем, что в Соединенных Штатах эти факторы взаимосвязаны, а как обстоит дело в других странах? Можно ли без всяких сомнений распространять результаты наблюдений, проведенных в США, на другие страны?, Не могло ли случиться так, что в системе образования США есть нечто особенное, что и порождает эту зависимость? Единственный способ выяснить это – провести исследования за рубежом.

Из предположения, что образование повышает вероятность участия в голосовании, мы могли бы сделать вывод, что человек, окончивший колледж, скорее поймет участие в голосовании, чем тот, кто имеет лишь диплом об [c.59] окончании средней школы. Мы можем проверить это предположение, посмотрев, соответствует ли оно данным ряда других стран. Чем чаще мы будем убеждаться, что данные согласуются с выдвинутым предположением, тем сильнее будет наша уверенность в том, что теория адекватно предсказывает поведение людей. Мы никогда не можем быть абсолютно уверены, что теория “верна”, так как она не в состоянии ни учесть все случаи, ни предусмотреть возможные изменения эмпирических взаимосвязей с течением времени. Однако мы можем обрести большую или меньшую уверенность в применимости теории, сравнив выводимые из нее предположения со своими наблюдениями. Если теория позволяет правильно предсказать ранее не наблюдавшиеся явления, она полезна.

Теории, представляющие собой множества понятий, предположений и утверждений, никогда не бывают раз и навсегда доказаны или опровергнуты. Правильнее считать, что мы приобретаем уверенность в полезности теории по мере того, как у нас накапливаются наблюдения, согласующиеся с выводимыми из нее ожиданиями, или гипотезами. Наоборот, по мере того как накапливаются наблюдения, не согласующиеся с гипотезами, следующими из теории, наша уверенность уменьшается. Поэтому то, что мы называем проверкой теории, в действительности сводится к проверке гипотез. Совершенствование теории в значительной степени основано на процессе сравнения условий, предсказываемых Гипотезой, с действительностью и модификации теории на основе полученных результатов, с тем чтобы выводимые из нее гипотезы все более и более соответствовали тому, что мы наблюдаем. В этой связи крайне важно учитывать, как стоящие перед нами проблемы преобразуются в гипотезы, которые берутся на вооружение при эмпирическом исследовании и предоставляют нам сведения, позволяющие установить адекватность теоретических объяснений. [c.60]

РОЛЬ ГИПОТЕЗ

Гипотеза – это, в сущности, утверждение о том, как, по нашему мнению, обстоят дела в действительности. Она сообщает о том, что мы ожидаем увидеть в результате правильно организованных наблюдений за событиями, [c.60] происходящими в реальном мире. Гипотезы представляют собой декларативные предположения, описывающие ожидаемые нами взаимосвязи между явлениями, обозначаемыми нашими понятиями. Обычно они формулируются в следующем общем виде:

Чем выше (ниже, значительнее, больше, медленнее и т. п.) _______, тем выше (ниже, значительнее, больше, медленнее и т. п.)______.

Прочерки будут заполнены названиями явлений, которые, как мы ожидаем, изменяются одновременно. Например, исходя из теории, модель которой дана на рис.2.2, мы могли бы предложить следующую гипотезу:

Чем выше в округе процент бедного населения, тем скорее их представитель будет голосовать в поддержку законов о социальном обеспечении.

Это предсказывающая, ковариционная гипотеза. Она не сообщает, как определяются результаты голосования, однако указывает нам нечто, что мы можем наблюдать, пытаясь получить данные о соответствии между теорией и действительностью.

Получение этих данных с помощью эмпирического наблюдения требует перехода от теории, сформулированной в самом общем виде, к более конкретному уровню, на котором можно организовывать наблюдение. Поступая таким образом, мы должны начать рассуждать в терминах переменных. Переменная может быть определена как эмпирически наблюдаемое свойство некоторого явления, которое может принимать более одного значения. Например, такие переменные, как пол и национальность, могут принимать ограниченное число значений, и могут быть “измерены” лишь качественно, путем приписывания им таких характеристик, как “мужской” или “англичанин”. Другие переменные, как, например, возраст и годовой доход, могут иметь гораздо более широкий спектр значений; их можно измерять количественно путем подсчета.

Переменные позволяют переводить утверждения, содержащие лишь абстрактные понятия, в утверждения с более точными эмпирическими определениями, так что эмпирическая правильность утверждений Может быть оценена. У нас нет необходимости использовать различные термины для понятий, имеющих Точные эмпирические определения, таких, как возраст или пол. Однако более абстрактные понятия для проведения исследований могут потребовать представления в виде переменных. Например, [c.61] важное место в политологии занимает понятие плюрализма, однако его эмпирические референты не совсем ясны. Чтобы проверить эмпирическую правильность утверждения, связывающего плюрализм с другими объектами, мы должны представить это понятие в виде переменной или множества переменных, имеющих отчетливые эмпирические определения. В качестве переменной, представляющей в нашем исследовании понятие плюрализма, можно было бы использовать число организованных групп в стране, связанных определенными интересами. Затем мы можем обдумать все, начиная с отношений между переменными, чтобы оценить эмпирическую правильность утверждений об отношениях между понятиями. Если нам захочется считать, что переменная число организованных групп по интересам отражает основное значение понятия плюрализм, мы захотим получить подтверждение, что эта переменная связана с некоторой другой переменной (такой, как уровень правительственных расходов на социальное обеспечение), в доказательство того, что плюрализм также связан с этой второй переменной или понятием, которое она отражает.

Переменные занимают центральное место в процессе исследования по двум причинам. Во-первых, предоставляя более четкие эмпирические определения, они помогают установить, за чем следует наблюдать, чтобы проверить нашу теорию. Во-вторых, зная, какова роль переменных в рамках гипотез, мы можем организовать наше наблюдение. Переменные, которые рассматриваются как меняющие свое значение в ответ на изменение значения других переменных, называются зависимыми переменными. Их значение зависит от значения других переменных. Переменные, которые воздействуют на значение других переменных, меняя свои собственные значения, называются независимыми переменными.

Будет ли переменная зависимой или независимой, определяется отношением, утверждаемым гипотезой, содержащей данную переменную. Одна и та же переменная может быть зависимой в одном исследовании и независимой в другом. Например, некий исследователь, наблюдая за лоббистской борьбой заинтересованных групп, мог бы сделать вывод, что, чем больше в государстве организованных групп, связанных определенными интересами, тем выше будет [c.62] уровень правительственных расходов на программы по социальному обеспечению. В этом случае число групп является независимой переменной (НП), а уровень расходов – зависимой переменной (ЗП). Другой исследователь мог бы прийти к выводу, что группы, связанные определенными интересами, возникают в результате осознания людьми возможности получения от правительства определенных благ, и утверждать, что, чем больше средств правительство тратит на социальное обеспечение, тем больше будет число организованных групп, имеющих свои интересы. Здесь правительственные расходы – независимая переменная, а количество групп – зависимая. Различие между двумя точками зрения на возникающие в этих случаях отношения изображены на рис.2.3.

Все это очень важно, так как цель исследования отчасти определяется той ролью, которая приписана различным переменным. Если мы утверждаем, что рост числа заинтересованных групп ведет к увеличению правительственных расходов, мы не собираемся исследовать увеличение правительственных ассигнований в период между 1970 и 1980 гг., а затем отмечать изменение количества организованных групп в период между 1980 и 1990 гг. Этот рост никак не связан с уровнем предшествовавших ему расходов. Если же мы выдвигаем гипотезу, что увеличение расходов ведет к росту числа групп, то подойдет только что описанная стратегия исследования. Поскольку знания о зависимом или независимом статусе переменных помогают организовать проведение исследования, наши гипотезы должны очень аккуратно фиксировать этот статус. [c.63]

При внимательном рассмотрении рис.2.3 мы обнаруживаем еще один тип переменной, важной для социального анализа. В теории, представленной в виде диаграммы на рис.2.3a, лоббистская деятельность является промежуточной переменной; она возникает между числом организованных групп, связанных общими интересами, и уровнем правительственных ассигнований. Промежуточные переменные осуществляют связь между независимыми и зависимыми переменными. В этом случае заинтересованные группы не могли бы воздействовать на уровень правительственных ассигнований, если бы они Не занялись парламентской деятельностью, чтобы получить фонды, предназначенные для этой цели. Если бы организациям было запрещено действовать в кулуарах законодательных органов, появление организаций, представляющих заинтересованные группы, не связывалось бы с уровнем правительственных ассигнований.

На рис.2.3б в качестве промежуточной переменной выступает осознание возможных благ. Переменная организация заинтересованных групп не была бы связана с уровнем общественных ассигнований, если бы члены группы не осознавали выгод организованности. Если бы, например, почти все правительственные ассигнования шли на оборонные проекты и лишь небольшая часть – на внутренние программы, многие граждане могли бы не видеть никакой пользы от увеличения правительственных ассигнований и не организовывались бы в группы даже тогда, когда общественные ассигнования быстро возрастали.

Промежуточные переменные регулируют взаимосвязи между другими переменными. Это означает, что значение, принимаемое промежуточными переменными, может воздействовать на силу и направление отношений между другими переменными. Если лоббистская деятельность в ситуации, изображенной на рис.2.3a, незначительна, связь между организацией заинтересованных групп и общественными ассигнованиями будет слабой. Если Деятельность носит активный характер, связь между двумя другими переменными будет сильной.

Поскольку промежуточные переменные определяют отношения между другими переменными, знание роли, которую они играют, будет оказывать влияние на наши ожидания, касающиеся связей между переменными. Если [c.64] мы строим теорию, в соответствии с которой лоббистская деятельность занимает промежуточное положение между организацией групп и увеличением ассигнований, мы можем дать следующие прогнозы:

Организация заинтересованных групп будет положительным образом связана с увеличением правительственных ассигнований в том случае, если лоббистская деятельность носит активный характер.

Организация заинтересованных групп будет лишь незначительно связана с правительственными ассигнованиями в том случае, когда лоббистская деятельность очень ограничена.

При этом недостаточно просто предсказать, что организация заинтересованных групп будет связана с увеличением правительственных ассигнований, так как, по нашему мнению, наличие связи между двумя переменными зависит от значения промежуточной переменной – лоббистской деятельности. Поэтому в наших теориях мы должны точно определить порядок отношений и роль, выполняемую каждой переменной.

Последний тип переменной, существенный в этой связи, – это антецедентная переменная. В то время как промежуточные переменные занимают место между независимой и зависимой переменными, антецедентные переменные вступают в действие до независимой переменной. Проводившиеся в США исследования поведения на выборах показали, что люди, глубоко осознающие партийную принадлежность, с большей вероятностью принимают участие в голосовании, чем те, у кого такого осознания нет. Мы могли бы сделать из этого вывод, что осознание партийной принадлежности способствует участию в голосовании. Однако что заставляет одних глубоко чувствовать партийную принадлежность, а других нет? Вероятно, важную роль в формировании у человека чувства партийной принадлежности играет глубина чувства партийной принадлежности, свойственного его родителям. Таким образом, партийная принадлежность родителей является антецедентной переменной в каузальной цепи, обусловливающей вероятность голосования.

Использование в наших теориях промежуточных и антецедентных переменных помогает уточнить понятие каузальных цепей, реально действующих и способствующих появлению явлений, которые мы хотим объяснить. Это увеличивает возможности по формированию гипотез, с [c.65] помощью которых мы можем проверить полезность наших теорий, поскольку гипотезы – это в значительной степени утверждения об отношениях между переменными. Они создают основу для сбора данных об эмпирической полезности всей нашей теоретической конструкции. Чем больше отношений мы постулируем и чем детальнее эти отношения, тем больше прогнозов об окружающем мире мы можем дать и тем более мощными средствами проверки нашей теории мы располагаем.

Остается открытым вопрос, каким образом мы получаем эти прогнозы, или гипотезы. Как именно мы решаем, какие отношения между переменными использовать при формулировании гипотез, вокруг которых организуются исследовательские проекты? [c.66]

ФОРМУЛИРОВАНИЕ ГИПОТЕЗ

Мы приходим к гипотезам либо путем индуктивного, либо путем дедуктивного рассуждения; это зависит от стадии процесса исследования, на которой мы находимся. Если для построения теории мы пользуемся методом проб и ошибок, гипотезы можно выдвигать с помощью процесса индуктивного обобщения. Например, отметив, что в США уровень участия граждан в политической жизни в разных штатах различен и при этом пропорционален уровню индустриализации, мы могли бы расширить данное наблюдение и утверждать, что это отношение между переменными может быть найдено и при сравнении разных государств. Если найдутся данные, подтверждающие эту гипотезу, у нас будет больше оснований включить индустриализацию в качестве переменной в теорию, предназначенную для объяснения политической активности. Однако до тех пор, пока у нас нет теории, позволяющей ответить на вопрос, почему индустриализация и политическая активность связаны друг с другом, мы не можем использовать факт их связи для объяснения политической активности.

Гипотезы, полученные индуктивным путем, могут играть важную роль в поисковом исследовании, которое полезно при построении теорий, но они оказываются бесполезными для объяснения явлений. Как только мы построили теорию, соединяющую наши переменные в логически связную систему, мы можем выводить из нее гипотезы [c.66] с помощью дедуктивного рассуждения. Так как эти гипотезы являются прогнозами о мире, логически следующими из теории, с которой мы работаем, то выявление фактов, подтверждающих гипотезу, помогает давать объяснение событиям, поскольку обнаружение таких фактов отражает валидность теоретической системы, из которой выведены гипотезы.

Дедуктивное рассуждение – очень хорошо разработанная дисциплина, и мы не будем здесь объяснять ее правила³. Однако важно отметить, что дедуктивная логика – это процесс, с помощью которого может быть эксплицирована информация, содержащаяся в наборе утверждений. Пользуясь одной лишь дедукцией, мы не в состоянии узнать об отношениях между переменными ничего нового. Мы используем дедукцию, только чтобы извлечь всю возможную информацию из того, что уже известно об этих отношениях. Дедукция используется для уточнения выводов, следующих из наших предположений, и именно это уточнение создает гипотезы.

Дедукция, приведенная на рис.2.1б, демонстрирует следующее. Если сформулированное предположение правильно, т.е. если республиканская партия привлекает только консерваторов, то любое подмножество членов этой партии также будет консервативным, а поскольку республиканцы Мидлтауна являются членами этой партии, они также будут консерваторами. Именно такой способ рассуждения мы имеем в виду, когда говорим, что одно следствие “логически вытекает” из другого. Вывод о том, что все республиканцы в Мидлтауне будут консерваторами, логически следует из предположения, что республиканская партия привлекает одних лишь консерваторов.

Задача построения гипотезы состоит в том, чтобы логическим путем сделать такой вывод, исходя из предположений, входящих в состав наших теорий. Именно потому, что гипотезы выводятся из теорий таким способом, проверка гипотез является косвенной проверкой теорий. Если мы опросим должным образом сформированную выборку из числа республиканцев Мидлтауна и обнаружим, что не все они консервативны, у нас будут все основания усомниться в валидности нашего предположения. Обнаружение среди республиканцев Мидлтауна либералов покажет, что республиканская партия привлекает не одних лишь [c.67] консерваторов. В этом случае нам нужно изменить свое предположение так, чтобы теория более точно соответствовала действительности, например, чтобы оно звучало следующим образом: “Республиканская партия имеет тенденцию привлекать скорее консерваторов, чем либералов”. Из этого предположения мы можем вывести гипотезу: “Среди членов республиканской партии в Мидлтауне будет больше консерваторов, чем либералов”.

Если среди республиканцев Мидлтауна мы обнаружим нескольких либералов и много консерваторов, мы сможем утверждать, что данные согласуются с гипотезой и с тем видоизмененным предположением, из которого она была выведена. И тем не менее мы не можем считать сделанное предположение валидным до тех пор, пока не убедимся, что оно подтверждается данными о консервативном или либеральном характере более обширной выборки из числа членов республиканской партии на общенациональном уровне. В конце концов, Мидлтаун мог быть в каком-то отношении уникальным. Возможно, например, что во всем городе наберется всего лишь десяток либералов, и тот факт, что лишь некоторые из членов республиканской партии являются либералами, оказывается результатом скорее этого, чем относительной привлекательности партии для либералов или консерваторов.

Здесь важно подчеркнуть, что данные, подтверждающие правильность гипотез, являются данными, подтверждающими правильность теории, лишь тогда, когда гипотезы связаны с теорией правилами дедуктивной логики. Только в этом случае мы можем без опасений переходить от данных относительно валидности гипотезы к любому суждению, касающемуся исходной теории. В ходе такого процесса логического вывода гипотез, проверки их фактами действительности и оценки теории в свете полученных результатов теории развиваются, дополняются и совершенствуются.

Особенно важную роль в этом процессе играет один вид гипотез – это альтернативные конкурирующие гипотезы. У любого события много возможных объяснений. Некоторые из этих объяснений будут полностью согласованы друг с другом, по крайней мере одно объяснение может быть правильным. Однако в некоторых случая объяснения могут противоречить одно другому: если правильно [c.68] одно, не может быть правильно другое. Если мы формулируем объяснения в виде гипотез, то гипотезы, не согласованные друг с другом, называются альтернативными конкурирующими гипотезами. Они альтернативные, поскольку дают разные способы рассмотрения или понимания объясняемого события. Они конкурирующие, поскольку не могут быть одновременно валидными. Если верна одна из гипотез, другая должна быть неверной. Мы не можем проверять и сопоставлять все возможные альтернативные гипотезы, связанные с любым событием, однако если мы хотим доверять хотя бы одной гипотезе, то должны попытаться проверить основные конкурирующие гипотезы, чтобы убедиться, что наши наблюдения не увели нас в неверном направлении.

Широко распространенная форма альтернативной конкурирующей гипотезы – это гипотеза, в которой утверждается, что отношение между любыми двумя переменными является мнимым и что изменения обеих переменных на самом деле обусловлены некоторым третьим фактором. Этот тип альтернативных конкурирующих гипотез особенно полезен при проверке теорий, так как он предлагает способ исследования, дающий твердую основу для оценки того, какая из двух рассматриваемых гипотез более правильная.

Вспомним приводившийся выше пример с установлением причинного отношения между ценами на ром и жалованьем министров, где отношение устанавливалось на том основании, что две эти переменные статистически действительно связаны. Основная альтернативная конкурирующая гипотеза состоит в том, что изменения обеих переменных вызваны изменениями общих экономических условий, представленных в виде уровня цен. Если данная гипотеза правильна, связь между ценами на ром и жалованьем министров исчезнет, как только мы сможем “контролировать”, т.е. поддерживать постоянным, воздействие уровня цен. Существуют статистические методы и исследовательские проекты, позволяющие определить, так ли это. Если мы обнаружим, что при условии контроля за общим уровнем цен статистическая связь между ценами на ром и жалованьем министров исчезает, у нас появится основание отвергнуть первоначальную гипотезу и заменить ее конкурирующей. Если соотношение между [c.69] ценами на ром и жалованьем сохраняется даже после того, как установлен контроль за общим уровнем цен, мы сможем в большей степени доверять гипотезе о том, что эти переменные действительно связаны. [c.70]

ВЫВОДЫ

Теории получают признание как полезные интеллектуальные инструменты при выполнении двух условий: при обнаружении данных, согласующихся с предсказаниями теорий, и при исключении конкурирующих гипотез. Однако необходимо помнить, что никакое отдельно взятое исследование не дает достаточных данных для принятия или отклонения какой бы то ни было теории или части теории, которая имеет дело с явлениями, не рассматривавшимися в данном исследовании. Всегда остается вероятность, что в ходе будущих исследований появятся данные, опровергающие валидность теории. Мы всегда должны быть готовы к встрече с противоречащими фактами и охотно обращаться к индукции для включения новых данных в более полезные теории. Построение теории – это процесс постоянного взаимодействия между предположениями и данными, между рассуждением и исследованием. Он требует и творческой изобретательности, и практического эмпиризма. Хорошую порцию последнего мы надеемся преподнести вам в следующих главах. [c.70]

3-лекция. ОТ АБСТРАКТНОГО К КОНКРЕТНОМУ: ОПЕРАЦИОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ

Каждое качество проявляет себя в определенном количестве, а без количества не может быть качества. До настоящего времени многие наши товарищи все еще не понимают, что необходимо уделять внимание количественному аспекту вещей – основополагающей статистике, основным процентным соотношениям и количественным пределам, определяющим качество вещей. У них в голове нет “цифр”, и в результате они не могут не делать ошибок.

Мао Цзэдун

Эмпирическое исследование– это способ получения ответов на вопросы о действительности. Наши вопросы могут быть главным образом практическими либо представлять преимущественно академический интерес. В любом случае они, возможно, будут сформулированы в абстрактной форме. Тем не менее ответы, которые мы хотим получить, обычно носят конкретный и специальный характер. Одна из первых проблем исследования – разработать способы перехода от абстрактного уровня вопросов к конкретным наблюдениям, которые позволят нам ответить на них.

Приведем пример не из области политики: предположим, мы хотим разрешить спор, какой из двух профессиональных футбольных защитников является лучшим спортсменом. Очевидно, нам придется каким-то образом сравнивать этих двоих, чтобы выработать свои аргументы. Но на каких основаниях мы будем их сравнивать? Мы хотим определить, у кого из них больше качеств хорошего спортсмена, однако спортивное мастерство – абстрактное понятие. Чтобы оценить каждого защитника в терминах этого качества, нам придется количественно определить понятие спортивного мастерства. Мы могли бы подсчитывать число сделанных ими передач во время игр, транслировавшихся по телевидению, поделить это число на число передач, которые они пытались сделать, и считать получающуюся в результате количественную оценку показателем спортивного мастерства. Или, что более вероятно, мы могли бы выполнять несколько таких операций по оценке действий игроков, так чтобы иметь более полную [c.72] картину того, насколько хорошо эти спортсмены выполняют функции защитника, и затем определенным образом их комбинировать. Получив новые количественные отношения, мы сможем сделать конкретные сравнения и разрешить спор.

То, что мы только что описали, – это, по существу, процесс, посредством которого в социальном исследовании осуществляется переход от абстрактного понятия к конкретным наблюдениям. Это решающий этап процесса исследования, поскольку лишь в том случае, если он выполнен правильно, собранная нами информация даст сведения о полезности наших теорий или позволит получить ответы на наши вопросы. Процесс сбора наблюдаемых явлений для представления абстрактных понятий известен как операционализация, а уточнение шагов, которые следует предпринять при ведении наблюдений, называется инструментализацией. Результатом ее является измерение, а измерение мы в конце концов используем в качестве свидетельства, принимая решения и отвечая на вопросы.

В настоящей главе мы подробно опишем эти процессы и обсудим проблемы, которые могут возникнуть при попытке операционализации и измерения понятий. Усвоив эту главу, вы сможете сформулировать объяснения, выработанные в результате анализа литературы, в форме, допускающей их проверку посредством реальных наблюдений. Обсуждаемые здесь действия представляют собой тот этап процесса исследования, после которого можно приступать к разработке плана исследования и сбору данных. [c.73]

ОПЕРАЦИОНАЛИЗАЦИЯ: СВЯЗЬ МЕЖДУ ТЕОРИЕЙ И НАБЛЮДЕНИЕМ

В гл. 2 мы подчеркивали важность наличия теории для руководства наблюдением. В самых общих чертах процесс исследования описан как процесс сравнения реальных наблюдений с теоретическими представлениями, для того чтобы мы могли оценить, насколько можно доверять теориям как объяснениям политических явлений. Эти представления формулируются в виде гипотез, предсказывающих наличие взаимосвязей между переменными, которые Представляют понятия теории. Цель настоящей главы – описать план проведения наблюдений, которые позволят произвести такие сравнения. Проблема заключается [c.73] в том, каким образом количественно представить наши понятия, так чтобы иметь возможность точно сказать, подтверждаются или нет наблюдениями наши теоретические представления.

Возникающие при этом проблемы в области социальных наук, по существу, не отличаются от проблем в области естественных наук. Простой пример помогает дать кое-какие пояснения на этот счет. Допустим, мы хотим проверить гипотезу о том, что минеральное удобрение, внесенное на одном поле, в большей степени стимулирует рост, чем естественные питательные вещества, обнаруженные на другом поле. Рост – это абстрактное понятие. Мы не можем увидеть его непосредственно, необходимо перевести рост в эмпирически наблюдаемую переменную, так чтобы мы могли определить, когда одно растение характеризуется им в большей степени, чем другие.

Можно представить понятие росте с помощью переменной достигнутая высота, поскольку относительная высота эмпирически наблюдаема. Однако стебли кукурузы отметок высоты не имеют; мы должны установить их сами. Но как это сделать? Мы попытаемся оценить с помощью наблюдателя кукурузу на двух полях как высокую или низкую. Однако такая процедура позволяет осуществить лишь грубое сравнение растений; при этом возможны разного рода ошибки, поскольку люди могут оценить переменную высота по-разному. Если мы хотим делать осмысленные сравнения, необходим более точный и надежный способ определения высоты.

Переменную высоты следует представить в виде значений какого-либо измерительного прибора, который может быть использован для получения точных, стандартизированных сведений о степени проявления данной характеристики у отдельных растений. Можно допустить, чтобы высота была представлена показателем, таким, как длина в дюймах, и измерить растения с помощью мерной ленты. Тогда данные, считываемые с мерной ленты, становятся значениями, которые мы приписываем растениям по переменной высота; эти значения и есть то, что мы реально сравниваем, пытаясь определить правильность нашего предсказания относительно величины роста растения на одном поле по сравнению с другим. [c.74]

Итак, мы перешли от абстрактного понятия рост к переменной высота и далее к показателю длина в дюймах. Это преобразование и есть то, что называется операционализацией, поскольку мы свели абстрактное понятие к множеству значений, которые могут быть получены с помощью специальных операций. И наконец, мы производим сравнения, на основании которых сможем оценить правильность нашей гипотезы об относительном росте, воспользовавшись сравнением значений, полученных в результате процесса измерения (в нашем примере – показаний, считанных с мерной ленты). Когда мы говорим о наблюдении в исследовании, мы имеем в виду процесс использования измерительного инструмента в целях приписывания значений некоторой характеристики или свойcтва рассматриваемого явления тем объектам, которые подвергаются изучению. Иными словами, наблюдение означает использование инструмента для измерения свойства или поведения.

Это очень важный момент. Он поясняет роль операционализации и измерения в процессе исследования. Мы никогда не можем реально сравнивать понятия, хотя наши теории, а зачастую и проблемы, будут сформулированы в терминах понятий. Мы сравниваем показатели понявший. В приведенном выше примере мы не можем сравнивать рост растений на двух полях. Мы можем сравнивать лишь данные, считанные с мерной ленты измерения, полученные с помощью показателя, который, как мы решили, представляет наше понятие.

Это означает, что наши сравнения могут быть точны лишь в той степени, в которой выбранные показатели отражают понятие, для измерения которого они предназначены. Если мы неправильно операционализировали наши понятия, отношение между показателями может неверно отражать отношение между понятиями, которые они должны представлять. В результате любые выводы, которые мы получаем исходя из понятий или теории, частью которой эти понятия являются, оказываются ошибочными.

Рис.3.1 иллюстрирует эту ситуацию. Теория устанавливает отношение между двумя абстрактными понятиями. Гипотеза предсказывает наличие отношения между двумя эмпирически наблюдаемыми переменными, которые мы сводим к измеряемым показателям, а наши наблюдения выявляют [c.75] отношение (или отсутствие отношения) между двумя множествами значений этих показателей. Совершенно ясно, что мы можем сделать некоторые выводы о действительности на основе теоретических отношений лишь в том случае, если переменные хорошо соответствуют понятиям и показатели хорошо соответствуют переменным. Операционализация почти неизбежно приводит к некоторому упрощению или частичной утрате смысла, поскольку показатели редко передают все, что мы вкладываем в понятие. И хотя нам почти всегда приходится мириться с частичной утратой смысла, необходимо проводить операционализацию так, чтобы минимизировать этот недостаток. Нужно подыскивать такие показатели, которые передают возможно большую часть содержания понятий или отдельные его аспекты настолько точно, насколько это возможно.

Из всего этого вытекает ряд следствий, которые можно проиллюстрировать в нашем примере из области сельского хозяйства. После того как исследование начато, мы можем осознать, что в понятие “рост” входит нечто большее, чем высота, и что показатель “длина в дюймах” не полностью отражает то, что мы хотим измерить. Например, может оказаться, что два поля существенно различаются с точки зрения роста растений, однако все различия касаются диаметра стебля, ширины листьев и веса початка, а высота растений на обоих полях может различаться не очень существенно. В этом случае если при оценке результатов применения удобрения мы будем учитывать только высоту, то допустим серьезную ошибку, так как связь между понятием (рост) и переменной, которая его представляет (высота), неполноценна. Взятая переменная не полностью операционализирует понятие, которое она [c.76] представляет. Она не улавливает все значение понятия, и ее использование дает неправильное представление о связи, существующей в реальном мире.

Это особенно часто встречающаяся ситуация в социологических науках, так как наиболее важные их понятия многомерны в том смысле, что они имеют более чем один аспект или компонент. Вводимые нами критерии этих понятий должны отражать их многомерность (т.е. многообразие, несходство), если мы хотим, чтобы они были использованы как индикаторы концепции. Например, если критерием понятия “демократия” мы изберем только проведение регулярных выборов, то существует вероятность того, что мы классифицируем как демократические диктаторские режимы, которые также проводят выборы, но только с одним кандидатом на пост и не допускают свободы выражения мнений. В таком случае диктатуру мы будем рассматривать как западноевропейскую демократию. Чтобы получить корректный критерий того, какую нацию считать демократической, мы, несомненно, нуждаемся в индикаторах, отражающих все разнообразие этого понятия.

Этот простой пример поясняет, почему операционализации принадлежит решающая роль в проверке теории и во всем процессе исследования. Гораздо труднее объяснить, как обеспечить должную операционализацию. Это происходит потому, что подбор переменных для передачи понятий и разработка показателей для переменных в значительной степени требуют приложения творческих способностей и не могут быть сведены к множеству стандартизованных действий, которые безошибочно позволят получить необходимые измерения. Единственное, что мы можем сделать, – это указать некоторые подводные камни в процессе операционализации, которых следует избегать, и описать способы оценки адекватности операционализации, которые уже сделаны. Об этом мы расскажем в разделах главы, посвященных измерению. [c.77]

ОПЕРАЦИОННЫЕ ОПРЕДЕЛЕНИЯ

Однако, прежде чем перейти к обсуждению проблемы измерения в социальной науке, необходимо рассмотреть, из чего состоит операционализация понятия. Это делается путем уточнения набора процедур, которым надо [c.77] следовать, или операций, которые надо выполнять для получения эмпирического показателя проявления понятия в каждом отдельном случае. Эти процедуры дают операционное определение понятия и соответствующей ему переменной. Процесс операционализации в существенной степени сводится к задаче выбора операционных определений для понятий.

Чтобы приносить пользу (т. е. давать валидные и надежные измерения понятий), операционные определения должны точно и эксплицитно сообщать, что следует делать для определения того, какое количественное значение должно быть приписано переменной в каждом отдельном случае. Операционные определения должны точно задавать все шаги, выполняемые в процессе измерения.

Мы хотим быть точными в этом вопросе по крайней мере по трем причинам. Во-первых, мы стремимся к тому, чтобы точно сообщить другим исследователям, что именно мы сделали для получения наших измерений, так чтобы они могли оценить нашу работу и, быть может, повторить наше исследование для проверки результатов в другой ситуации. Во-вторых, если у нас есть ассистенты, занимающиеся сбором информации, мы захотим сделать наши инструкции достаточно детальными и точными, чтобы все они осуществляли измерения в равных условиях. Если наши инструкции расплывчаты, наши ассистенты при осуществлении измерений будут предпринимать несколько отличные способы действий, их результаты окажутся несопоставимы и мы не сможем сделать на их основании валидные выводы. И наконец, точные и детальные утверждения о том, как операционализировать переменную, помогут нам в оценке полученных результатов и в устранении конкурирующих объяснений для результатов, полученных из-за дефектов процесса измерения. (Мы подробнее поговорим об этом в других разделах данной главы.)

Рассмотрение следующего гипотетического примера поможет вам понять, что требуется при построении операционного определения. Предположим, по заданию университета вы должны провести работу по оценке результатов воздействия сладких безалкогольных напитков на академическую успеваемость студентов. На основании этого исследования должно быть решено, оставлять ли в [c.78] университетском городке торговые автоматы. Эта задача в основном сводится к проверке следующей гипотезы:

Чем большее количество сладких безалкогольных напитков выпивает студент, тем ниже качество его (или ее) академической успеваемости.

Для решения задачи вам придется построить операционные определения для ключевых понятий потребление безалкогольных напитков и академическая успеваемость. Для простоты предположим, что понятие академической успеваемости вы представили в виде переменной средняя оценка, второе ключевое понятие – в виде ответов студентов на прямой вопрос о потреблении ими безалкогольных напитков. После выбора колледжей и студентов, которые войдут в исследование, вы должны разработать процедуры для выполнения соответствующих измерений и проинструктировать ассистентов относительно того, как применять эти процедуры. Чтобы обеспечить сведения о зависимости переменной (академическая успеваемость), вам придется точно определить, откуда можно взять оценки, как подсчитать среднюю оценку и как формализовать информацию. Чтобы обеспечить измерение независимой переменной, вам придется дать точную формулировку вопросов, которые будут задаваться, и точно определить, как записывать различные возможные ответы на эти вопросы.

При разработке операционных определений для переменных, используемых в исследовании, вам необходимо дать скрупулезное описание процедур, используемых для осуществления измерений. Каждый шаг должен быть детально расписан. Это не только позволяет сделать описание исследования и обеспечивает стандартность процедур измерения, но и дает возможность продумать весь процесс осуществления измерения для определения возможных ошибок, которые могут сказаться на надежности результатов.

Предположим, мы хотим измерить степень поддержки, которую члены двух основных партий оказывают своей партии в законодательных органах штата. Мы можем операционализировать понятие “партийное единство” путем обращения к поименному голосованию и в дальнейшем использовать процент совпадений голосования среднего члена партии с голосованием большинства его партии как показатель единства при голосовании. Однако, решив [c.79] поступить таким образом, мы столкнемся с многовариантностью при реальной операционализации нашей переменной.

Информация о том, как голосует каждый законодатель, может быть получена из протоколов законодательного органа, однако после этого необходимо решить, какое из многих зафиксированных в протоколе голосований следует включить в наш подсчет. Одни голосования являются единодушными (такие, как голосование о выпуске прокламации в честь какого-нибудь национального героя) и не отражают партийного единства, поскольку не включают партийных проблем. Включение всех голосований снижает степень, в которой наше измерение отражает наше понятие. Мы должны выработать критерии для отбора голосований, подлежащих учету. Например, для того чтобы сосредоточивать внимание только на дискуссионных вопросах, мы могли бы отбирать для исследования только те поименные голосования, в которых принимают участие по крайней мере 2/3 законодателей и в которых побежденная сторона получает не менее 30% голосов.

Необходимо также решить, как разработать процедуру определения результатов голосования большинства членов партии, для того чтобы установить, соответствует ли голосование каждого члена партии позиции большинства. Мы должны решить, как поступать с воздержавшимися: считать ли их поведение за отказ от поддержки своей партии или исключать их из подсчета? Кроме того, нам нужно точно определить процедуру первоначального подсчета и последующего усреднения процентного содержания согласованных голосований для каждого законодателя.

При каждой операционализации мы сталкиваемся с необходимостью принимать сходные решения при определении того, какими процедурами пользоваться для получения соответствующих измерений. Полное операционное определение демонстрирует, как мы решили поступать с такими проблемами, и не оставляет никаких сомнений относительного того, что мы реально делали, производя наши измерения.

В результате построения операционного определения разрабатывается инструмент для выполнения измерений. В естественных науках для получения показателей, характеризующих степень проявления у физических [c.80] объектов некоторого свойства, применяются такие инструменты, как шкалы, экспонометры и микрометры. В социальных науках используются измерительные инструменты совсем иного рода. К числу типичных для социальных наук инструментов относятся: вопросы о форме проведения исследования; инструкции по проведению и описанию наблюдений за определенными событиями, такими, как дебаты на заседаниях ООН; множество характеристик, получаемых из справочника, и правила их объединения для формирования измерения.

Надлежащий инструментарий в социальных науках не менее важен, чем в естественных. Точно так же, как мы не стали бы измерять вес с помощью линейки, мы не захотели бы измерять политическое отчуждение с помощью вопросов, не выявляющих состояния людей, испытывающих отчуждение. Обсуждая в следующем разделе валидность и надежность измерений, мы предложим некоторые способы проверки инструментов, разработанных в процессе операционализации, которые укрепляют нашу уверенность в том, что эти инструменты измеряют то, что мы хотим. [c.81]

ИЗМЕРЕНИЕ

Мы операционализируем переменные, чтобы иметь возможность количественно представлять абстрактные понятия и осуществлять осмысленное сравнение явлений реального мира в терминах свойств, задаваемых этими понятиями. Такое приписывание числовых значений для представления свойств носит название измерения¹. В результате измерения в каждом конкретном случае с переменной ассоциируется некоторое значение². Это означает только то, что мы с большей точностью можем говорить о том, в какой степени данный объект наблюдения (например, человек, город, нация или организация) проявляет свойство, которое представлено измеряемой переменной. Вместо того чтобы говорить, что в городе “плохи дела в связи с преступностью”, мы сможем говорить о конкретных размерах преступности. Вместо того чтобы говорить о ком-то “преданный республиканец”, можно сказать, что он (или она) получил 5 баллов по нашей шкале силы идентификации партийной принадлежности. [c.81]

УРОВНИ ИЗМЕРЕНИЯ

Процедуры измерения предоставляют средство категоризации и упорядочения явлений. Вместе с тем одни процедуры дают возможность выявить более тонкие и детальные различия между событиями, чем другие. Поэтому нам приходится констатировать различные уровни измерения. Говоря о том, что процедура обеспечивает данный уровень измерения, мы квалифицируем ее в соответствии с количеством поставляемой ею информации об измеряемых явлениях и их взаимоотношениях друг с другом. Уровни измерения носят название номинального, порядкового и интервального.

Номинальное измерение представляет минимальную информацию о явлении. Оно дает лишь набор дискретных категорий, позволяющих разграничить разные объекты. Номинальное измерение – это простое наименование объектов в соответствии с заранее заданной схемой классификации. Национальность обычно “измеряется” на номинальном уровне посредством классификации людей на англичан, швейцарцев, бразильцев и т. п. Это “измерение” не сообщает, насколько характеристика “национальность” свойственна разным людям, и не позволяет упорядочивать их. Использование номинального измерения всего лишь дает возможность объединить объекты в классы, обозначенные так, как это принято в классификационной схеме.

Чтобы быть полезными, схемы номинального измерения должны основываться на множествах категорий, которые являются взаимоисключающими и исчерпывающими. Это означает, что (1) невозможно отнести один объект к более чем одной категории и (2) категории должны быть такими, чтобы каждый объект мог быть отнесен к той или иной категории. Если мы хотим расклассифицировать всех избирателей Соединенных Штатов с помощью схемы номинального измерения, мы не можем воспользоваться категориями демократ, республиканец, либерал и консерватор, так как они не являются взаимоисключающими. Поскольку американские политические партии обращаются к самым широким массам избирателей, человек вполне может оказаться одновременно демократом и консерватором или либералом, одновременно республиканцем и консерватором или либералом. Эти [c.82] категории не дают возможности провести разграничение между избирателями во всех случаях. Аналогично, если мы попытаемся расклассифицировать избирателей на основании партийной принадлежности, используя только две категории: республиканец и демократ, – мы обнаружим, что наши категории не являются исчерпывающими, так как некоторые избиратели считают себя независимыми либо членами других партий.

Для упрощения анализа мы, быть может, захотим заменить категории в схеме номинального измерения числами. Важно понимать, однако, что в данном контексте эти числа не имеют реального значения – они всего лишь символы. Исходя из того, что мы решили заменить категорию республиканец цифрой 5, а категорию демократ – цифрой 1, мы не можем считать, что у республиканцев в пять раз больше приверженцев, чем у демократов. Любая категория номинального измерения может быть заменена любым числом, при условии, что у каждой категории будет свой индивидуальный номер.

Порядковое измерение предоставляет больше информации, так как дает возможность не только категоризовать, но и упорядочивать, или ранжировать, явления. Порядковое измерение позволяет присваивать каждому объекту число, которое обозначает не только то, что данный объект отличен от одних объектов и сходен с другими с точки зрения измеряемой переменной, это число указывает также, как именно данный объект связан с другими в терминах количества того конкретного свойства, которым он характеризуется. Располагая порядковым измерением, мы можем сказать, какие объекты характеризуются большим (или меньшим) количеством измеряемого свойства по сравнению с какими-то другими объектами; мы можем также расположить объекты по порядку в зависимости от количества того свойства, которое их характеризует. Такое упорядочение дает более детальную и более точную информацию, чем номинальное измерение. Понятие социальный класс обычно измеряется на порядковом уровне: каждому человеку приписывается ранг низшего, среднего или высшего класса.

Интервальное измерение предоставляет еще больше информации. Мы можем не только классифицировать и упорядочивать объекты, после того как они измерены на [c.83] интервальном уровне, но и сказать, насколько большим или меньшим количеством измеряемого свойства по сравнению с другими объектами они характеризуются. Порядковое измерение не основано ни на какой стандартной для данной переменной единице и не позволяет установить, насколько далеко в терминах этой переменной отстоят друг от друга разные объекты. Оно лишь позволяет говорить, что у одних объектов данная переменная имеет большее или меньшее значение, чем у других. Интервальное измерение основано на представлении о существовании некоторой стандартной единицы измеряемого свойства.

В то время как порядковые измерения дают нам лишь огрубленное представление об отношении между объектами с точки зрения данной переменной, интервальные измерения предоставляют информацию о “расстоянии” между ними. Хороший пример такого рода – переменная доход. Доход обычно измеряется в денежных единицах (в Соединенных Штатах это доллары и центы). Поскольку при измерении используются стандартные единицы, мы можем утверждать, что между 10000 и 11000 долларов годового дохода разница абсолютно та же, что и между 50000 и 51000 долларов. Мы не в состоянии сделать этого с помощью порядкового измерения. Если измерять доход с помощью порядкового измерения, разделяя людей по их доходу на такие категории, как доход ниже 5000 долларов и доход от 5000 до 9999 долларов, мы сможем сказать, что у одного человека доход выше или ниже, чем у другого, однако мы не сможем сказать точно, насколько эти люди различаются по своим доходам, так как не знаем, где именно находится человек внутри своей категории. Различие в доходе между человеком из категории 1 (до 5000 долларов) и человеком из категории 2 (от 5000 до 9999 долларов) может составлять всего лишь один доллар (5 000 долларов минус 4 999 долларов), а может доходить до 9999 долларов (9999 долларов минус 0 долларов) в зависимости от точной цифры их доходов, однако мы не можем увидать этой разницы, исходя из порядкового измерения.

Помимо того что интервальное измерение дает нам точную информацию об абсолютных различиях между объектами, мы также получаем возможность делать [c.84] точные утверждения об относительных различиях между понятиями. Мы, например, можем согласиться с тем, что население 50000 человек – это в два раза больше, чем население 25000 человек, потому что ведь есть такие места, где вообще никто не живет: в истинных интервальных измерениях существует нулевая точка, и по крайней мере теоретически возможно существование объектов, имеющих на таких шкалах нулевую отметку. Так как на порядковой шкале не существует осмысленной нулевой точки, мы не можем говорить, например, что люди высшего класса имеют в два раза большее количество “класса”, чем люди низшего класса, – мы не знаем, что означает “не иметь никакого классового статуса”.

На основании всего этого следует сделать одно важное замечание относительно уровня измерения. Когда речь идет о сравнении явлений, измерения номинального уровня – наименее полезный тип измерения. Если мы используем его в ситуации, когда возможно использовать “более высокий” (более точный) уровень измерения, мы можем потерять потенциально ценную информацию. Если при изучении поведения на выборах мы приводим классификацию людей на республиканцев, независимых и демократов, в то время как можно задать другой набор вопросов и осуществить их ранговое упорядочение с учетом [c.85] перехода от более сильной к более слабой партийной идентификации, мы, возможно, отказываемся от информации, которая поможет нам понять наблюдаемые отношения. Измерение порядкового уровня полезнее, чем измерение номинального уровня, но у него также есть свои ограничения. Интервальное измерение – наиболее желательная форма измерения как в силу того, что оно дает наиболее детальную информацию, так и потому, что оно позволяет осуществлять математическую обработку имеющихся данных. (Подробнее об этом будет говориться в гл. 14,15 и 16.)

Наша задача состоит в том, чтобы там, где это возможно и удобно, стремиться к операционализациям, позволяющим осуществлять измерение интервального уровня. Однако каким образом мы выбираем уровень измерения, подходящий для конкретных понятий, операционализацией которых мы занимаемся? Это проблема как концептуализации, так и технологии измерения.

В процессе исследования на этапе построения теории мы должны прежде всего спросить себя, лежит ли в основе различий, наблюдаемых в отдельных случаях, некий континуум. Если да, то мы можем предложить для данного понятия порядковое или даже интервальное измерение, в противном случае в качестве измерения может выступать лишь номинальная классификация. Поясним важность этого на примере.

Предположим, мы изучаем зависимость между национальностью иммигрантов и степенью поддержки ими политического механизма большого города США начала XX века. Если мы осуществляем операционализацию национальности на номинальном уровне и категоризуем поддержку политического механизма в городских избирательных округах, мы, возможно, получим картину, подобную той, что изображена на рис.3.2а. Здесь не видно никакой отчетливой связи между национальностью и поведением на выборах, так как знание о том, какая национальность преобладает в данном округе, не позволяет ранжировать его относительно других округов. Однако если мы проанализируем ход наших рассуждений, то сможем понять, что наши ожидания относительно связи национальности с поддержкой политического механизма имеют определенные основания: соответствующие страны [c.86] происхождения различны с точки зрения возможности участия в политической жизни, которое они предоставляют своим гражданам. Мы можем сделать вывод, что те, кто имеет небольшой опыт существования в условиях демократии, будут с готовностью передавать свое право на самоуправление политическим лидерам. Если исходить из этого и упорядочить страны в соответствии допускаемой ими степенью участия своих граждан в политике, мы можем построить график, подобный тому, что изображен на рис.3.2б. На этом графике отчетливо видна взаимосвязь национальности с поддержкой политического механизма. Упорядочение категорий по независимой переменной помогает выявить систему в ее отношениях с зависимой переменной.

Если у нас хватит смелости, мы можем даже повысить уровень измерения независимой переменной до интервального. Мы, например, могли бы подсчитать количество постановлений, касающихся участия в политической жизни, в законодательствах соответствующих стран на протяжении нескольких лет, непосредственно предшествующих началу широкой иммиграции в США. Полученные цифры можно использовать для ранжирования национальностей на интервальной шкале и осуществить даже более точное сравнение независимой и зависимой переменных.

Сможем ли мы осуществить такое повышение ранга переменных, чтобы перейти от номинального уровня измерения к порядковому или интервальному, зависит как от разработки теоретического обоснования такого перехода, так и от наличия технических возможностей применения операционных процедур, осуществляющих измерения более высокого уровня. Даже если мы сможем в нашем примере выразить понятие национальности в терминах интервального уровня, мы, возможно, не получим в свое распоряжение законодательные акты, необходимые для расположения стран на интервальной шкале. В этом случае наши возможности по получению измерений более высокого уровня ограничивает измерительная техника. Примеры такого рода достаточно многочисленны. Например, при исследовании взаимосвязи между полом и политическим поведением у нас будет возможность утверждать, что мужские черты характера – это свойство, [c.87] которым люди обладают в разной степени (те, кто обладает им в наименьшей степени, – женщины). Если мы можем выступить с набором вопросов для выяснения того, насколько люди обладают этим свойством (если вообще обладают), мы в принципе можем упорядочить людей на порядковой или интервальной шкале “мужественности”. Однако если мы не располагаем денежными средствами для проведения исследования, в ходе которого люди ответят на эти вопросы, нам придется рассчитывать на номинальную классификацию мужчина/женщина, сведения о которой мы находим в списках членов партии.

Эти ситуационные факты затрудняют установление правил того, как операционализировать понятия с целью достичь определенных уровней измерения. Однако мы полагаем, что можно следовать правилу операционализации У.Ф.Шайвли³. Он советует использовать максимально точные для данного объекта измерения и не терять информацию за счет неточного измерения. Это обычно означает применение более строгих процедур измерения, которые там, где это возможно, осуществляли бы измерение более высоких уровней. Не довольствуйтесь операционализацией, дающей номинальное измерение, когда теоретически оправданно и технически возможно порядковое или интервальное измерение.

Сделав данные замечания, мы должны сказать о некоторых исключениях из основного правила. Существуют случаи, когда слишком большая точность измерения на самом деле нежелательна. Один пример такого рода приводит Шайвли. Из его работы заимствован (с некоторыми изменениями) рис.3.3. На рисунке двумя разными способами изображена зависимость между возрастом и голосованием на президентских выборах 1968 г. На рис.3.3а возраст измеряется в годах. Поскольку в каждой возрастной группе (например, 21–22 года, 35–36 лет, 50– 51 год) оказывается немного людей, на диаграмме не выявляется никакой отчетливой структуры отношений между двумя переменными. На рис.3.3б возраст измеряется менее точно – в пятилетиях. Наличие в каждой группе большого числа объектов позволяет увидеть явную структуру отношений: вероятность голосования повышается до 50-летнего возраста, а затем, вообще говоря, снижается. [c.88]

Пожертвовав некоторой точностью измерения, мы получили выигрыш с точки зрения простоты анализа. Это удачная сделка, пока мы не зашли столь далеко по пути уменьшения точности, чтобы вновь потерять из виду изучаемые соотношения. Если мы используем для измерения возраста 20-летний интервал, мы не увидим больших количественных различий между возрастными группами голосующих и сможем прийти к выводу, что возраст не связан с вероятностью голосования. Поскольку заранее до реального анализа данных мы, как правило, не знаем, какая точность окажется необходимой для выявления соотношений, мы должны следовать правилу, в соответствии с которым осуществляется по возможности максимально точная операционализация понятий. Мы всегда сумеем отказаться от ненужной точности путем “сжатия категорий” (перехода к более крупным различительным единицам), если сочтем это нужным. Однако если не собрать информацию в самом начале, мы не сможем обратиться к ней в дальнейшем. [c.90]

РАБОЧАЯ ГИПОТЕЗА

Измерение приписывает объектам значения в соответствии с данными переменными. Именно эти значения используются для представления понятий при сравнении наших наблюдений. Прежде чем понять, какие выводы в отношении теории следуют из наших наблюдений, мы должны представить гипотезы, касающиеся отношений между переменными в виде рабочих гипотез, которые устанавливают ожидаемые отношения между измерениями или показателями. Предпоследняя строчка на рис.3.1 предлагает форму, в которой выступают рабочие гипотезы. Эти гипотезы требуют от нас установления связи между показателями и переменными, которые, по нашему мнению, следуют из осуществленной операционализации.

Рассмотрим пример из области международных отношений. Предположим, нас интересует теория доминации в сфере международной жизни. Исходя из теоретического допущения: “Чем более сильное влияние испытывает государство, тем более конформистскую политику оно проводит”, – мы можем выдвинуть следующую гипотезу: “Когда возрастает экономическая зависимость государства, [c.90] возрастает и степень поддержки, оказываемой им государству-покровителю”. Мы можем операционализировать экономическую зависимость как процент экспортной продукции, идущей государству-покровителю. Процент экспорта становится в нашем случае независимой переменной зависимость. Поддержка может измеряться процентом голосований в Генеральной Ассамблее ООН, в которых зависимое государство голосует иначе, чем государство-покровитель. Процент голосований в ООН становится в нашем случае показателем зависимой переменной поддержка политики государства-покровителя. Теперь мы можем сформулировать рабочую гипотезу, утверждающую наличие между показателями отрицательного отношения: когда процент продукции, экспортируемой государству-покровителю, возрастает, процент голосований в ООН, не согласующихся с позиций государства-покровителя, уменьшается.

Эта рабочая гипотеза сообщает о том, какие наблюдения согласуются с нашей гипотезой и нашей теорией. Она также предлагает возможные отношения между переменными и показателями, которые у нас имеются. Это отношение изображено на рис.3.4.

Рисунок демонстрирует, насколько важно было додумать до конца соотношение между измерениями и переменными. Отношение, предсказанное утверждением и гипотезой, является положительным. А рабочая гипотеза [c.91] предсказывает отрицательное отношение. Это объясняется тем, что отношение между зависимой переменной и ее показателем является отрицательным. В свою очередь это означает, что вследствие того, как мы провели операционализацию зависимой переменной, именно отрицательное отношение между показателями предоставляет данные в поддержку гипотезы и теоретического утверждения, которое предсказывает положительные отношения между понятиями и переменными. Мы должны осознавать это, если хотим избежать неправильной интерпретации данных и сделать на основании наблюдений правильные выводы относительно полезности нашей теории.

Установление отношений между показателями, переменными и понятиями, которые они представляют, настолько важно, что некоторые исследователи в области социальных наук требуют создания наряду с теориями, касающимися политических феноменов, теории измерений, которая бы объясняла наши представления относительно связей между показателями и понятиями⁴. Что заставляет нас связывать экономическую зависимость с возрастанием экспорта? Какие особенности в распределении экспорта позволяют ему выступать в качестве отражения того, что мы имеем в виду, говоря о зависимости? На такого рода вопросы помогает ответить хорошо разработанная теория измерений. Положения теории измерений объясняют, почему показатели должны менять значения при изменении степени соответствия реальных объектов понятиям.

Показатели выбираются не случайным образом, а в результате тщательного продумывания связей между объектами реального мира. Сходные процессы осуществляются и при разработке теорий, касающихся политических феноменов: выводы, к которым мы приходим, могут оказаться неправильными, свойства, которые мы имеем в виду, используя некоторые понятия, могут на самом деле оказаться не связанными с показателями, которые мы решили использовать в качестве эмпирических мер этого понятия.

Вернемся к примеру с исследованием, которое должно определить, мешают ли безалкогольные напитки академической успеваемости. Мы решили измерять употребление безалкогольных напитков, просто задавая [c.92] студентам вопрос, сколько газированной воды они выпивают за некоторый период времени, предполагая, что они скажут правду и что те, кто выпивает больше, получат более высокое значение нашего показателя, чем те, кто выпивает меньше. Предположим, однако, что ответы студентов на наши вопросы полностью определяются тем, догадались ли они о цели исследования и хотят ли они обмануть университетское начальство в отношении количества потребляемых ими безалкогольных напитков. При таком повороте дел предполагаемая связь между переменной и показателем не будет зафиксирована и мы не сможем, опираясь на наши исследования, сделать на законных основаниях какие-либо выводы о результатах воздействия безалкогольных напитков, если только мы не предложим какое-либо альтернативное измерение.

Обсуждаемая спорная проблема существует ли какая-либо связь между нашим понятием и переменными, с одной стороны, и нашим индикатором или критерием – с другой, стала основной для вопроса о выработке критериев в науке. Вопрос, действительно ли изменения в наших индикаторах есть результат изменений в понятии, которое они представляют, тесно связан с проблемами надежности и достоверности, которые мы обсудим в последующих разделах настоящей главы. Важным моментом здесь является то, что идея теории измерений поможет найти подходы к этим проблемам в нашем исследовании.

Любая операционализация понятия – это, в сущности, гипотеза. Когда мы проводим операционализацию и говорим: “Пусть данное понятие обозначается таким-то показателем”, – мы выдвигаем гипотезу, что объекты, которые мы имеем в виду, используя данное понятие, действительно отражаются в выбранном показателе. Эта гипотеза может подтверждаться, а может и не подтверждаться наблюдениями. Мы не имеем права просто доверять адекватности наших измерений, мы должны проследить за проведенными наблюдениями, чтобы найти факты, подтверждающие, что измерения действительно отражают то, что мы имеем в виду под понятиями. Поиск валидных и надежных процедур измерения в социальных науках – это во многом процесс проверки гипотез. Нужно быть готовым признать ошибки и начать все сначала, если факты говорят о том, что введенные показатели не отражают [c.93] наши понятия. Проверка измерений происходит в первую очередь при попытках оценить валидность и надежность выбираемых показателей. [c.94]

ОШИБКА ИЗМЕРЕНИЯ

В результате измерения разным объектам приписываются различные значения на основе оценок, заданных нашими показателями. Дифференциация в оценках может возникать за счет двух основных источников. Первый источник – это величина реального проявления у объектов определенной степени или аспекта интересующего нас свойства. Разные оценки возникают тогда, когда наши измерения действительно улавливают эту дифференциацию. В этом случае измерения отражают реальные различия между понятиями. Другой источник дифференциации значений – та величина, которая относится к самому измерению или к условиям его осуществления, что предопределяет наличие разных значений у разных объектов. В этой ситуации наши измерения не демонстрируют реальных различий между объектами, т. е. таких, которые отражают подлинную дифференциацию понятий, которые мы хотим измерять. Наблюдаемые нами в этом случае различия возникают из-за погрешностей в процедуре измерения.

Если бы наши измерения были совершенны, они бы демонстрировали только различия первого рода. Однако наши измерения крайне редко (если вообще когда-либо) бывают безупречными. Дифференциация значений, приписываемых разным объектам, неизбежно отражает не только реальные различия в степени проявления некоторого понятия, но и “искусственные” различия, обусловленные процессом измерения. Любая дифференциация значений, приписанных реальным объектам, обусловленная чем бы то ни было, кроме действительных различий, относится к ошибкам измерения. Они представляют собой не действительные различия между объектами, а различия, зарегистрированные ошибочно, из-за недочетов процесса измерения.

Грань между истинными вариациями оценок и вариациями, обусловленными ошибкой измерения, подобна различиям между объектами, фиксируемыми невооруженным глазом, и различиями, отмечаемыми лишь при [c.94] разглядывании их отражения в зеркале. В той степени, в какой зеркало искажает образы, оно либо скрадывает различия, которые можно было бы увидеть невооруженным глазом, либо создает впечатление существования различий, которые мы в других условиях не заметили бы. В социальных науках у нас крайне редко появляется возможность наблюдать ключевые понятия непосредственно, и мы вынуждены полагаться на отражение этих понятий с помощью измерительных процедур, аналогичных зеркалу. Соответственно, правильность наших представлений зависит от точности, с которой наши измерения отражают действительность.

Каковы хотя бы некоторые из источников искажения образов, обусловленных нашими измерениями? Необходимо знать ответ на этот вопрос, если хотим контролировать ошибки измерения или распознавать их, когда они присутствуют в наших данных. Мы можем перечислить несколько основных источников ошибок измерения, установив наиболее частые источники различий в оценках, относимых к другим, неистинным различиям в характеристиках, которые мы хотим измерить⁵.

1. Различия в распределении между объектами других, относительно постоянных характеристик, которые были непреднамеренно выявлены нашими измерениями. Например, для понимания вопросов, предназначенных для измерения политической идеологии, и ответа на них может понадобиться определенный уровень интеллекта. Если это так, ответы на вопросы будут отражать не только политико-идеологические, но и интеллектуальные различия между людьми. В окончательном результате влияние интеллекта и влияние политической идеологии будут перемешаны, и мы не сможем определить различия в оценках, обусловленные идеологическими факторами, и отличить их от различий, обусловленных интеллектуальными факторами. Аналогичным образом другие характеристики наших единиц анализа (такие, как региональное расположение городов, культурные особенности нации или источники документов) могут случайно отразиться в наших измерениях и исказить наше восприятие рассматриваемых понятий. Там, где эти “возмущающие” воздействия можно выявить и измерить, необходимо посмотреть, что произойдет, если поддерживать их значения на постоянном [c.95] уровне: исчезнут, уменьшатся или увеличатся различия в оценках, которые получают объекты по нашим измерениям⁶.

2. Различия в распределении между объектами временных характеристик, которые отражаются в наших измерениях. Характер ответов на вопросы анкеты может определяться настроением или состоянием здоровья отвечающего. Недавние события в политической жизни города (например, раскрытие случаев коррупции среди должностных лиц) могут создавать временные, но систематические различия в том, как жители этих городов отвечают на вопросы исследования. Большое стихийное бедствие может произвести коренные и вместе с тем временные изменения в статистических данных, на которые мы опираемся при выяснении уровня экономического развития. Обнаруживать и контролировать воздействие таких временных “аномалий” труднее, чем воздействие постоянных характеристик объектов. Единственный способ уберечься от воздействий такого рода – это внимательно относиться к сигналам, предупреждающим о том, что отдельные объекты находятся под влиянием таких преходящих факторов (например, изучать недавние события в политической жизни городов, входящих в нашу выборку, или советовать интервьюерам не проводить интервью с человеком, который в данный момент тяжело болен), и выполнять процедуры, предназначенные для проверки надежности измерений (такие процедуры описываются в разделе данной главы, посвященном надежности).

3. Различия, проявляющиеся при интерпретации измерительного инструмента разными людьми. Это проблема возникает лишь в том случае, когда люди прямо отвечают на вопросы, а не тогда, когда исследователь осуществляет измерения, наблюдая за поведением. Если вопросы сформулированы неоднозначно, то и респонденты дадут им разные интерпретации, которые могут привести к различиям в оценках по измерениям, составленным на основании этих вопросов. Предположим, например, что, изучая поведение на выборах, мы несколько легкомысленно задали вопрос: “Вы принимали участие в последних выборах?” Если кто-либо из интервьюируемых не знает, что на прошлой неделе проводились муниципальные выборы, он может ответить да, так как думает, что вопрос относится к [c.96] последним общенациональным выборам, хотя он и не принимал участия в выборах, которые подразумевались в наших вопросах. Обезопасить себя от этих непредвиденных различий в оценках наших измерений можно с помощью предварительных вопросов (см. гл. 6) и проверки измерений на надежность.

4. Различия в условиях проведения измерения. Этот источник ошибок измерения также находится главным образом в исследованиях, результаты которых измеряются с помощью ответов на вопросы. Например, в ходе выборочного исследования надежно установлено, что на характер ответов могут оказывать влияние раса, пол и возраст интервьюера. Ответы (а следовательно, и оценки на шкалах) могут варьироваться от интервью к интервью в зависимости от характеристик самого интервьюера. Сходные проблемы могут возникнуть не только в ходе выборочного исследования. Например, мы можем ошибочно осуществить контент-анализ передачи последних известий, предназначенных для внутреннего вещания, и передачи последних известий, предназначенных для зарубежного вещания. Мы в таком случае будем применять один и тот же инструмент в совершенно разных условиях и на основе одного этого факта вправе ожидать появления различий в оценках. Избежать ошибки измерения такого рода можно одним способом – прилагать все усилия к тому, чтобы ситуации, в которых осуществляются измерения, были стандартизованы.

5. Различия в процессе применения измерительных инструментов. Приписываемые объектам оценки могут различаться в результате разнообразных ошибок, возникающих при сборе и записи информации. Интервьюеры могут неверно понять инструкции и задавать вопросы не так, как предполагал исследователь. Плохое освещение может оказаться причиной того, что респондент неправильно отметит пункты анкеты. В самый ответственный момент карандаш может сломаться, а в авторучке кончиться чернила, так что наблюдатели не сумеют зафиксировать ключевые для группового взаимодействия события. Из-за усталости кодировщик может изменить или проигнорировать инструкции по кодированию единиц в контент-анализе. Все эти типы отклонений в процессе применения измерительных инструментов приводят к [c.97] различиям в оценках вне зависимости от каких бы то ни было различий в реальных значениях исследуемой переменной. Основной способ борьбы с ошибками измерения (помимо привлечения к работе надежных ассистентов) – предварительная проверка инструментов измерения. Пробный прогон поможет вскрыть потенциальные “технические” проблемы, возникающие при применении данного инструмента (такие, как недостаток места в кодовой форме для записи типовых ответов), и человеческие факторы, которые могут сказаться на результатах (например, время, в течение которого наблюдатели могут работать не утомляясь).

6. Различия в обработке и анализе данных. Прежде чем информация может быть проанализирована, она должна подвергнуться тщательной обработке. Часто информация по нескольку раз меняет форму. Например, интервьюеры могут зафиксировать ответы на вопрос, записав каждое слово, сказанное интервьюируемым. Впоследствии, при кодировке ответов, эти письменные фрагменты могут сокращаться, превращаясь в одну-единственную цифру. Эта цифра может быть зафиксирована в битах магнитного диска или магнитной ленты. На каждом из этих этапов анализ данных становится все проще, однако с каждым следующим этапом увеличивается возможность ошибок, в результате которых объекты начинают различаться по некоторой переменной, в то время как на самом деле они не различаются. Возможность таких ошибок приводит к необходимости дважды и трижды проверять данные при каждом преобразовании и сохранять исходную форму для последующей проверки.

7. Различия в характере реакции индивидуумов на форму измерительных инструментов. Эта проблема приобретает важное значение тогда, когда объектами анализа являются люди. Измерительные инструменты могут выступать в самых разнообразных формах – это и устные интервью, и анкеты, которые должен заполнить опрашиваемый, и наблюдение подготовленного исследователя. Различные формы предъявляют к людям – объектам исследования разные требования. Интервью, к примеру, требует умения свободно говорить, анкета – читать и писать. Если люди различаются с точки зрения этих способностей, их оценки могут различаться даже тогда, когда люди [c.98] в действительности сходны по той переменной, которая операционализируется. Лучший способ избежать ошибок измерения такого типа – использовать более чем одну форму измерения для операционализации каждого понятия. Мы еще поговорим об этом в разделе данной главы, посвященном валидности.

Все эти факторы могут привести к проникновению в исследование ошибки измерения. Различные ошибки, происходящие из семи перечисленных источников, обычно подразделяются на систематические и случайные. Систематические ошибки – это ошибки, которые возникают из-за путаницы переменных в реальном мире (см. п. 1) или из-за особенностей самого инструмента. Они появляются каждый раз, когда используется данный инструмент, и постоянно сопутствуют объектам и исследованиям, в которых используется одно и то же измерение. Постоянные ошибки делают наши результаты невалидными в том смысле, что различия (или сходства), которые, как представляется, выявляют наши измерения, не есть точные отражения различий, которые мы, по нашему мнению, измеряем. Случайные ошибки проявляются по-разному и обусловлены преходящими характеристиками объектов, ситуационными различиями в применении инструмента, ошибками в проведении измерения и обработке данных и другими факторами. Они делают наши измерения невалидными почти так же, как и систематические ошибки. Кроме того, случайные ошибки делают наши измерения ненадежными в том смысле, что проявление случайных ошибок не дает возможности постоянно получать одни и те же результаты при использовании одного и того же измерения.

Как же избежать столь разрушительного воздействия на наши результаты ошибок измерения, которое превращает наше исследование в бесполезное или ошибочное? Чтобы ответить на этот вопрос, необходимо внимательно обсудить проблемы валидности и надежности. [c.99]

ВАЛИДНОСТЬ

Мы не так уж часто имеем возможность непосредственно измерить понятия, используемые в социологических теориях. Такие понятия, как власть, демократия и представительство, не так просто представить количественно, [c.99] как понятия типа длины и веса. Нам приходится пользоваться показателями, лишь косвенно соответствующими понятиям, которые они представляют. А в таком случае всегда существует опасность, что выбранные показатели будут неадекватно отражать понятия, которые мы хотим с их помощью измерять. Для обозначения степени соответствия измерений понятиям, которые эти измерения должны отражать, используется термин валидность. Интересоваться валидностью измерения – то же самое, что интересоваться, действительно ли с помощью данного измерения мы измеряем то, что предполагали измерять. Обеспечение валидности часто считается основной проблемой, связанной с измерением в социальных науках.

Чтобы быть валидным, измерение должно быть исчерпывающим и полным. Если, например, мы сравниваем качество коммунальных служб в разных городах, у нас может возникнуть искушение считать показателем качества системы образования количество преподавателей в школах. Это – неуместное измерение, поскольку количество работающих в системе школьного образования в значительной степени определяется количеством учащихся и размерами города и может иметь мало общего с качеством образования. Если за показатель качества системы образования принять отношение количества учащихся к количеству учителей, мы получим более уместное измерение, так что различия, вызванные размерами города, уменьшатся или вообще исчезнут. Тем не менее измерение все еще останется недостаточным. Образование – это не только преподаватели. Образование – это также школьные задания, фильмы, книги, учебные пособия и множество других факторов. Рассмотрение каждого из этих факторов в отрыве от остальных может создать неверное впечатление о качестве системы образования. Система школьного образования может иметь в высшей степени благоприятное соотношение учащихся и преподавателей, однако недостаточное количество средств обучения и учебных материалов. Было бы ошибкой утверждать, что эта система школьного образования не отличается от системы с таким же соотношением учащихся и преподавателей и прекрасными средствами обучения и учебными материалами. Если мы стремимся к валидности, мы должны [c.100] попытаться выбрать такие измерения, которые были бы и уместными и полными.

В этой ситуации возникает два вопроса: как осуществить исчерпывающие, полные и уместные измерения и как убедиться в том, что нам удалось это сделать.

Ответ на первый вопрос начинается с процесса операционализации. Мы можем определить валидность как степень, в которой различия оценок измерения отражают только различия в распределении значений переменной, которую мы собираемся измерять. Так как мы, вероятно, никогда не сможем достичь полной и всеобщей валидности, наша цель должна заключаться в выборе измерений, которые были бы минимально чувствительны к воздействию всех иных различий, кроме различий, обусловленных интересующей нас переменной. Для этого необходимо внимательно рассмотреть все процессы, связанные с нашими измерениями, для обнаружения возможных причин различий в оценках. На этом этапе мы должны быть особенно внимательны, чтобы застраховаться от влияния систематических ошибок.

Рассмотрим такой пример. Возможно, нам понадобится измерить, в какой степени граждане разных государств согласны с политикой своих правительств. Мы решаем использовать в качестве показателя согласия или несогласия ответы на ряд специально подготовленных вопросов. Мы считаем, что единственным источником различий в ответах на вопросы являются различия мнений. Однако минутное размышление наводит на мысль о другом возможном источнике вариаций. Если среди исследуемых нами государств есть государства с авторитарным правительством, прибегающим к услугам секретной полиции для подавления инакомыслия и рассматривающим любую критику своей политики как акт государственной измены, граждане этих государств, вполне возможно, побоятся высказывать в интервью несогласие со своим правительством. В этом случае оценки, полученные для нашего измерения, могут по крайней мере в той же степени определяться отношением правительства данного государства к несогласным, в какой – мнением интервьюируемых, Поскольку вероятность ошибки измерения такого рода очень высока, подготовленные вопросы оказываются неподходящей операционализацией. [c.101]

Сходным образом в самом начале процесса исследования мы должны позаботиться о полноте. Если мы хотим измерить относительное влияние различных групп интересов в законодательном собрании штата, можно подумать об использовании в качестве показателя газетных сообщений о выступлениях этих групп перед законодательными комиссиями. Однако следует спросить себя, сводится ли политическое влияние к произнесению клятвенных заверений на публичных заседаниях. Эта деятельность законно считается частью процесса влияния, однако существует так много других средств оказания влияния, что измерение, опирающееся исключительно на произнесение заверений как показатель влияния, оказывается неполным.

Таким образом, получение уместных и относительно полных операционализаций зависит как от хорошего знания объекта нашего исследования, так и от осуществления тщательного логического анализа альтернативных операционализаций. Однако проверить валидность наших измерений для определения того, хороши ли они, можно лишь после того, как собраны данные. Процесс оценки валидности измерений называется валидизацией.

Имеется четыре основных подхода к валидизации. Первый часто называется прагматической валидизацией, поскольку валидность измерения оценивается на основе данных о том, насколько хорошо оно позволяет предсказывать поступки и события. Например, мы разрабатываем измерение для определения пригодности кандидатов на общественную должность, с точки зрения избирателей. Некоторый показатель валидности этого измерения можно получить, применив его ко всем кандидатам в сенат США в данном избирательном году и предсказав их шансы быть выбранными на основе сравнительных оценок по шкале привлекательности для избирателей. Чем более успешно мы предскажем результаты выборов для всех кандидатов, тем сильнее наша уверенность в валидности измерения, в том, что оно точно отражает понятие, которое мы имеем в виду. Принято говорить, что измерения, позволяющие предсказать будущие события, обладают прогностической валидностью.

Прагматическая валидизация требует наличия у переменных некоторого альтернативного показателя, [c.102] который, по нашему убеждению, является их валидным отражением. Мы проверяем наши измерения по этому альтернативному показателю, как могли бы проверять точность сообщения о возрасте по свидетельству о рождении. К сожалению, для понятий, используемых в социологических исследованиях, редко встречаются явно валидные альтернативные показатели. В итоге нам обычно приходится рассчитывать на валидизацию второго типа – конструктную валидизацию.

Конструктную валидизацию осуществляют, выводя валидность измерения из данных о степени соответствия реальных соотношений между оценками по различным измерениям ожиданий, следующих из теории, предписывающей нам использовать данный показатель. При этом рассуждение ведется по двум направлениям.

Прежде всего, мы должны сказать себе: “Если понятие Х положительно связано с понятием Y и отрицательно – с понятием Z (как и предсказывает наша теория), верно будет также и то, что оценки понятия Х в валидном измерении будут положительно связаны с оценками понятия Y в валидном измерении и отрицательно – с оценками понятия Z в валидном измерении”. Мы не можем валидизировать измерение, сравнивая оценки в этом измерении с оценками той же переменной в другом измерении, которое, как мы знаем, является валидным (как в случае свидетельства о рождении). Однако мы можем судить о его валидности по тому, в какой степени использование данного измерения в качестве показателя переменной создает те же типы отношений между данной переменной и другими переменными, которые мы ожидаем в соответствии с нашей теорией.

В качестве примера возьмем изучение международных сообществ. Мы могли бы построить измерение надежности такого союза на основе контент-анализа газетных публикаций соответствующих стран. Является ли валидным показателем надежности сообщества двух стран то. что газеты данного государства пишут о другом государстве? Мы могли бы ответить на этот вопрос, рассуждая следующим образом: “В соответствии с нашей теорией, чем надежнее сообщество государств, тем чаще они будут одинаково голосовать в ООН и тем меньше ограничений на взаимную торговлю они будут накладывать. Поэтому оценки [c.103] надежности сообщества в валидном измерении будут положительно связаны с оценками в измерениях одинакового голосования в ООН и отрицательно связаны с оценками в измерениях количества торговых ограничений. Затем мы переходим к анализу данных, необходимому для установления того, подтверждается ли это ожидание нашими наблюдениями. Если соотношения окажутся такими, как ожидалось, наша уверенность в валидности измерения надежности сообщества будет выше. Если соотношения будут иными, чем мы ожидали, мы зададимся вопросом, надежным ли измерением для этого понятия мы располагаем”.

То, что мы только что описали, часто называют внешней валидизацией. При этом осуществляется сравнение оценок в измерении, подвергающемся валидизации, с оценками в измерениях для других переменных. Разумеется, для использования этого метода валидизации нам придется включить в наше исследование измерения других переменных. Это означает, что нем следует обдумывать способы валидизации наших измерений уже на ранних этапах процесса исследования. Безусловно, к тому моменту, когда мы будем готовы разрабатывать план исследования, мы должны знать, как будет проверяться валидность наших измерений, для того чтобы наверняка собрать всю необходимую информацию.

Попытки внешней валидизации дадут убедительные доказательства валидности нашего измерения для одной переменной лишь в том случае, если мы будем убеждены в валидности измерений, используемых для остальных переменных. Так, в последнем примере мы не смогли бы сделать никаких выводов относительно валидности измерения надежности сообщества на основе соотношений оценок в данном измерении и оценок двух других переменных, если бы мы не считали показатели одинакового голосования и торговых ограничений валидными. Поскольку часто бывает трудно обнаружить безусловно валидные показатели для переменных, с которыми должна быть связана ключевая переменная, процедуры внешней валидизации следует применять с осторожностью. Все это очень напоминает процедуру проверки гипотезы. Никакой отдельно взятый результат не гарантирует валидности (или невалидности) измерения. Скорее, по мере накопления случаев успешной валидизации наша уверенность [c.104] в валидности измерения возрастает. По этой причине для использования во внешней валидизации разумно искать как можно больше предсказанных теорией отношений. Чем больше имеется в нашем распоряжении разных способов проверки валидности, тем надежнее наш результат.

Та же самая логика рассуждений применима ко второму типу конструктной валидизации – внутренней, или конвергентной, валидизции. Этот тип валидизации включает разработку нескольких измерений для одной и той же переменной и сравнение между собой этих разных измерений. Мы считаем, что, если каждый из показателей дает для рассматриваемого понятия валидное измерение, оценки, получаемые конкретными объектами в этих измерениях, должны быть тесно связаны. Если и А, и В, и С являются валидными измерениями для Х, то оценки любого конкретного объекта в измерениях А, В и С должны быть очень близки.

Предположим, например, что мы хотим получить показатель для качества уличного освещения в окрестностях жилья в рамках изучения работы коммунальных служб. Мы могли бы использовать в качестве такого показателя оценку достаточности уличного освещения, по мнению жителей (выявляется с помощью выборочных интервью). Мы можем выборочно опросить живущих по соседству людей, насколько хорошо, по их мнению, освещена улица около их дома, и взять среднюю оценку за меру качества уличного освещения. Чтобы осуществить внутреннюю валидизацию, мы можем измерить качество уличного освещения также: 1) использовав световой счетчик для получения физической меры яркости и распределения освещения; 2) получив оценки освещенности, сделанные специально обученными наблюдателями; 3) попросив жителей сравнить освещение на улицах с освещением на фотографиях, изображающих улицы, освещенные в разной степени, и усреднив их оценки для получения значения освещенности окрестностей их домов. Таким образом, мы получаем четыре измерения переменной. Если каждое из них является валидным, все они должны быть тесно связаны. Можно проверить это с помощью соответствующих статистических расчетов. Если мы обнаружим, что оценки измерения, в основе которого лежат ответы на вопросы интервью, слабо связаны с оценками остальных трех измерений и что при этом оценки этих трех измерений тесно [c.105] связаны друг с другом, у нас будет основание подозревать, что первое измерение невалидно.

Это очень похоже на взвешивание одного и того же предмета на трех разных весах. Если каждые весы показывают точный вес и у нас нет оснований считать, что в ходе эксперимента вес объекта изменился, мы вправе ожидать, что все эти весы покажут один и тот же вес. Если еще одни весы показывают вес, отличный от данного, можно подозревать, что они не отрегулированы.

На рис.3.5 изображены различия между внутренней и внешней формами конструктной валидизации. Рис.3.5а показывает, что внутренняя валидизация осуществляется через проверку соответствия оценок нескольких разных измерений для одного и того же понятия. Чем точнее это соответствие, тем увереннее мы себя чувствуем, утверждая, что каждое измерение валидно. Рис. 3.5б демонстрирует, что для внешней валидизации требуется установить, как наше измерение одной переменной связано с другими переменными, согласно теоретическим представлениям. Если ожидаемое отношение не проявляется, мы вправе подозревать, что выбранный нами показатель не обеспечивает валидного измерения для понятия. (В гл.14 мы обсудим статистические расчеты, которые можно использовать для определения степени реальной связанности разных измерений.)

Пользуясь внутренней валидизацией, необходимо соблюдать те же предосторожности, которые требуются при внешней валидизации. Мы не всегда можем быть уверены, что наши альтернативные измерения ключевого понятия валидны, и поэтому мы должны с осторожностью делать вывод о валидности или невалидности измерения [c.106] на основании любой проверки валидизации. Наша уверенность в результатах внутренней валидизации может существенно возрасти, если мы последуем простому правилу: альтернативные измерения понятия должны основываться на возможно большем числе различных операционализаций.

В примере с уличным освещением измерения имеют в качестве источника четыре разных типа операционализаций: словесные оценки жителей, физические измерения, оценки наблюдателей и отбор фотографий, произведенный жителями. Каждый из них представляет особый способ операционализации. Чем больше разных способов мы можем использовать и чем более они взаимонезависимы, тем больше мы можем доверять нашей валидизации. Почему? Логика рассуждения здесь такова. Основной источник невалидности – это систематические и случайные ошибки измерения. Разные измерения подвержены ошибкам разных типов. Чем больше показателей для некоторой переменной у нас имеется и чем сильнее они отличаются друг от друга, тем менее вероятно, что во всех показателях проявится одна и та же ошибка измерения. А если это так, то у нас будет больше возможностей обнаружить ошибку измерения как источник различий в оценках в любом измерении и получить точное измерение для переменной в том случае, если мы будем использовать множественные показатели⁷.

Например, факторы, способные сделать непригодным физическое измерение качества уличного освещения (такие, как неисправный световой счетчик), по-видимому, совершенно не связаны ни с какими факторами, которые могли бы внести систематические ошибки в измерение, основанное на оценках жителей (такими, как характерная для людей тенденция считать, основываясь на чувстве местного патриотизма, что их коммунальные службы не хуже, чем в других местах). Если мы используем только один способ измерения, любой источник ошибок измерения может сказаться на оценках в каждом измерении, постоянно предоставляя нам негодный показатель и не давая возможности осуществлять значимые сравнения между измерениями. Если, например, мы опираемся только на физическое измерение освещенности, но снимаем показания несколькими разными способами (на [c.107] тротуаре, на краю тротуара и на мостовой), любой дефект измерительного инструмента (в данном случае светового счетчика) будет оказывать влияние на все измерения и ни одно нельзя будет использовать для проверки другого.

При таком подходе множественные показатели для переменных имеют очень большое значение. Наличие множественных измерений не только дает нам возможность проверить валидность наших показателей, но также в первую очередь увеличивает наши шансы получить валидное измерение переменных. Множественные измерения могут на самом деле повысить валидность измерения, позволяя скомбинировать результаты нескольких разных процедур для получения сложной оценки, которая скорее будет являться правильным отражением действительного значения переменной, чем каждое из измерений, взятое в отдельности. Такая сложная оценка с большей вероятностью будет представлять собой валидное измерение, так как не исключено, что при объединении результатов нескольких процедур измерения ошибки, приводящие к невалидности каждого измерения, нейтрализуются.

Здесь действует практически тот же принцип, что и при взвешивании предмета на многих разных весах. Поскольку весы несовершенны, каждый прибор может показать несколько иное значение веса – чуть тяжелее или чуть легче. Однако если предмет взвешивается на нескольких весах, в соответствии с законами теории вероятности достаточно высока вероятность того, что эти небольшие ошибки нейтрализуют друг друга, давая средний вес, который является правильным. Сходным образом, если мы операционализируем понятия несколькими разными способами, так что ошибка измерения, связанная с каждой операционализацией, не зависит от ошибок, сопровождающих все остальные операционализации, мы получаем хорошие шансы обеспечить точное измерение понятия, комбинируя разные оценки. (В разделах гл.8, посвященных шкалированию и индексированию, будут описаны некоторые возможные методы комбинирования оценок для получения составного измерения.)

Третий способ валидизации называется дискриминантной валидизацией. Задавая вопрос, обладает ли измерение дискриминантной валидностью, мы интересуемся главным образом тем, возможно ли, используя данное [c.108] измерение в качестве показателя некоторого понятия, отличить это понятие от других. Например, если бы мы захотели измерять понятие доверия к политическим деятелям с помощью ряда вопросов обследования, а в нашей анкете есть ряд вопросов, предназначенных для измерения понятия доверия к людям (вообще), то, сравнивая оценки двух измерений, мы можем спросить себя, не отражает ли первый набор вопросов всего лишь иной способ измерения доверия к людям. Если оценки очень близки, мы скажем, что измерение политического доверия не обладает дискриминантной валидностью, поскольку не позволяет отличить понятие “доверие к политическим деятелям” от понятия “доверие к людям”. [c.109]

Наконец, последний способ валидизации опирается на понятие очевидной валидности. Некоторые измерения основаны на столь прямом наблюдении за исследуемым поведением, что задавать вопрос об их валидности представляется неразумным: такое измерение кажется валидным “по внешнему виду”. Предположим, например, что мы хотим измерить степень соблюдения государственного закона, требующего наличия на входной двери каждой фирмы патента на соответствующую деятельность. По-видимому, обучив наблюдателей просто отмечать наличие или отсутствие таких патентов, мы получим явно валидное измерение выполнения закона. И хотя мы всегда должны спрашивать себя, являются ли выбранные нами измерения валидными по внешнему виду, как правило, мы совершали бы ошибку, если бы гарантировали точность результатов исследования, опираясь на одну лишь очевидную валидность. Мы должны попытаться удостоверить валидность наших измерений с помощью стандартных процедур типа тех, что описывались выше.

Основные свойства четырех рассмотренных типов валидизации представлены в табл. 3.1. Если мы хотим на основании наших исследований сделать правильные выводы, мы должны располагать валидными измерениями. Однако чтобы быть валидными, измерения должны быть также надежными. [c.110]

Таблица 3.1

Типы валидизации

Прагматическая валидизация

Конструктная валидизация

Дискриминантная валидизация

Очевидная
валидизация

Сверить результаты, полученные путем использования показателя, с результатами, полученными путем использования другого показателя, признанного в качестве валидного измерения соответствующего понятия; или проверить прогностическую валидность показателя, использовав его для предсказания событий, отражающих измеряемое понятие.

Внутренняя (конвергентная) валидизация: сделать вывод о валидности показателя на основании его соотношения с другими показателями для того же самого понятия, использующего множественные показатели.

Внешняя валидизация: сделать вывод о валидности показателя на основании его соотношения с показателями для других понятий, с которыми измеряемое понятие теоретически должно быть связано.

Сделать вывод о валидности показателя на основании степени несоответствия показателям для других понятий, теоретически отличных от измеряемого понятия.

Признать валидность, исходя из непосредственной очевидности показателя. (Можно ли убедить людей, находящихся в курсе дела, что это валидный показатель для данного понятия?)

НАДЕЖНОСТЬ

Когда мы говорим о валидности измерения, нас интересует, насколько точно значения, получаемые с помощью этого измерения, соответствуют истинным значениям измеряемой переменной. Когда мы говорим о надежности измерения, нас интересует устойчивость получаемых с его помощью значений. Можем ли мы, применяя измерение несколько раз, получить для любого данного объекта одно и то же значение или же в результате разных подходов одним и тем же объектам приписываются разные значения? Если при неоднократном применении некоторого измерения один и тот же объект не получает одного и того же значения, это измерение является ненадежным показателем соответствующего понятия. Чтобы гарантировать надежность линеек, их изготавливают из нерастяжимого материала. Если бы линейки изготовляли из растяжимых материалов, они вполне могли бы [c.110] показывать разную длину одного и того же объекта (даже в том случае, если его длина на самом деле не изменилась) просто потому, что линейка растягивается и сжимается.

Если измерение ненадежно, оно не может быть валидным, поскольку по крайней мере некоторые различия в оценках, приписанных объектам, обусловлены ошибками измерения, а не истинными различиями между объектами. Вспомним наш пример с исследованием уличного освещения. Что, если используемый нами световой счетчик окажется настолько чувствительным, что будет фиксировать не только свет от уличных фонарей, но и лунный свет? Тогда значения переменной качество уличного освещения для каждой улицы будут зависеть как от яркости уличных фонарей, так и от случайных факторов, таких, как фазы луны и характера облачности. В той степени, в которой эти случайные факторы влияют на наши результаты, измерение оказывается невалидным отражением действительных различий в качестве уличного освещения. В этом случае ненадежность обусловливает невалидность.

Измерение может быть вполне надежным и все-таки невалидным. Вспомним приводившееся в качестве примера исследование того, в какой степени люди в разных государствах одобряют политику своего правительства. Мы говорили, что вопросы, задаваемые в ходе обследования, могут привести к невалидным измерениям, поскольку в авторитарных странах люди боятся говорить правду о том, что они думают. Так как данный фактор обусловливает скорее систематическую, чем случайную ошибку, вопросы могли бы давать весьма устойчивые результаты. Вне зависимости от того, сколько раз их спрашивают, люди могли бы отвечать одно и то же. Это, однако, не делает измерение валидным.

Таким образом, измерение может быть надежным, не будучи валидным, но не может быть валидным, не будучи надежным. В то время как валидность уязвима и со стороны систематической, и со стороны случайной ошибки, надежность подвергается опасности лишь со стороны последней. Это означает, что, если в предшествующих исследованиях измерение было убедительно валидизировано, мы можем использовать его, не беспокоясь о его надежности: [c.111] если измерение валидно, оно должно быть надежно. Однако, продемонстрировав надежность, мы не гарантируем валидность.

Как застраховаться от ненадежности? Как определить, надежно ли данное измерение? Чтобы предотвратить угрозу ненадежности, необходимо знать о различных источниках случайных ошибок измерения, описанных нами в данной главе, и делать все возможное для установления контроля над ними. Следует, в частности, продумывать реальный процесс измерения и проводить предварительное тестирование инструментов измерения для выявления ранее неизвестных причин случайных ошибок.

В социальных науках часто бывает довольно сложно определить, надежно ли предлагаемое нами измерение. Это происходит потому, что истинное значение переменных, с которыми мы имеем дело, может коренным образом изменяться с течением времени и под давлением обстоятельств: люди меняют свое мнение под влиянием опыта; государства начинают по-иному распределять ресурсы между социальными службами и ведомствами оборонного характера в ответ на возникновение военной угрозы и т. п. Когда реальные значения так или иначе изменяются, трудно бывает отличить результаты воздействия случайных ошибок измерения от действительных колебаний в рамках измеряемых понятий. Это означает, что тесты на надежность следует проводить через максимально короткие промежутки времени.

В социальных науках имеется три типа методов установления надежности измерений. Первый – это метод неоднократного тестирования. В этом случае одно и то же измерение снова и снова применяется в отношении одного и того же набора объектов. Если объекты всякий раз получают одну и ту же оценку, измерение считается надежным. Трудности с данным методом возникают в том случае, когда измерение связано с интервьюированием людей (в отличие от измерения характеристик неодушевленных объектов или осуществления скрытого наблюдения за людьми). Если мы повторяем вопросы через короткий промежуток времени, интервьюируемые могут помнить данные ими ранее ответы и, стараясь быть последовательными, будут повторять эти ответы, вместо того чтобы правдиво отвечать на поставленный вопрос. Если возникает [c.112] такая ситуация, мы оказываемся не в состоянии правильно оценить надежность вопросов как показателя для данного понятия. Пытаясь избежать такого тест-эффекта, мы могли бы приступить к повторному опросу лишь по прошествии значительного промежутка времени. Однако в этом случае мы столкнемся с другой проблемой: с течением времени истинные значения переменной могли измениться, и мы можем оказаться не в состоянии отличить изменения в оценках, возникающие из-за ненадежности измерения, от действительных изменений переменной.

Указанная проблема привела к созданию другого теста на надежность – метода альтернативной формы. В соответствии с этим методом в один и тот же момент разные формы измерения применяются к одной и той же группе объектов либо одно и то же измерение применяется к разным группам объектов. В этом случае тест-эффект невозможен, поскольку ни один объект не измеряется более одного раза, а так как измерения не отделены друг от друга никакими временными интервалами, на результатах измерений не могут сказаться реальные изменения исследуемых переменных. Однако успех этой стратегии зависит от того, насколько хорошо сопоставимы друг с другом альтернативные формы измерения как измерения данного понятия, и от того, действительно ли две группы эквивалентны с точки зрения дистрибуции измеряемой переменной. Если у нас есть основания полагать, что эти условия выполняются, то, чем более близки оценки по двум измерениям или по двум группам, тем более мы можем быть уверены в надежности измерения. Однако если в нашем распоряжении нет сравнимых измерений или групп, мы не можем использовать данный метод должным образом.

Наконец, последний способ тестирования надежности измерения известен под названием метода подвыборки. Этот метод заключается в том, что, сформировав выборку из объектов, мы делим ее на несколько подвыборок таким образом, чтобы все они были похожи друг на друга. Затем мы применяем одно и то же измерение ко всем подвыборкам и используем сходство или различие результатов для подвыборок как показатель надежности измерения. Поскольку мы используем одно и то же измерение, у нас нет [c.113] необходимости заботиться о сопоставимости, как в случае метода альтернативной формы; а так как для обеспечения эквивалентности подвыборок мы можем опираться на теорию выборки, нам не приходится беспокоиться о том, что выбранные для измерения группы окажутся недостаточно однородными. Так как ни один объект не измеряется дважды, мы можем не считать тест-эффект угрожающим точности нашего теста на надежность; а поскольку [c.114] измерения осуществляются одновременно, реальные изменения переменной не могут иметь значения для данного метода, как это происходит в случае метода неоднократного тестирования. Однако возможность использования метода подвыборки определяется тем, в состоянии ли мы получить такую большую выборку, что, разделив ее на части, мы будем располагать подвыборками, достаточными для того, чтобы применяемые нами статистические тесты были осмысленными. Это не всегда возможно и может послужить препятствием для использования метода подвыборки при проверке надежности.

Для интерпретации результатов каждого из этих тестов на надежность имеется множество статистических процедур⁸.

У описанных методов много разновидностей. Какой из вариантов в наибольшей степени подойдет для данного исследовательского проекта, будет зависеть от того, каким временем и возможностями располагает исследователь, а также от характера исследования. Например, если мы хотим измерить уличное освещение на основании оценки освещенности разных кварталов, сделанной обученными наблюдателями, мы можем спокойно воспользоваться методом неоднократного тестирования, не думая ни о каком тест-эффекте. Уличное освещение не будет изменяться просто потому, что его кто-то измеряет, и поэтому можно позволить разным наблюдателям независимо друг от друга оценивать одну и ту же улицу в одну и ту же ночь. Мы не сможем в такой же степени доверять этому методу, если наше измерение качества уличного освещения будет основываться на ответах, данных самими жителями на вопросы интервью.

Вне зависимости от того, какой тест на надежность мы предпочли использовать, надежность измерений важно установить до того, как будет начато исследование. Это требует предварительного тестирования измерения посредством сбора данных, предназначенных исключительно для оценки инструментов, которые будут использоваться в самом исследовании. Если нам не удастся это сделать, то может оказаться, что наши измерения ключевых переменных ненадежны (и поэтому невалидны), и выясниться это может лишь после того, как исследование завершено. А это означает, что мы не сможем доверять [c.115] результатам исследования и что наши усилия были полностью или частично потрачены впустую. Предварительное тестирование солидности и надежности измерения должно быть составной частью любого исследовательского проекта, если в нем используются измерения, которые не были где-нибудь убедительно валидизированы, или если этот проект полагается на измерения, которые были валидизированы только в условиях, очень сильно отличающихся от тех, в которых они будут использоваться. [c.116]

ВЫВОДЫ

К настоящему моменту мы ввели в рассмотрение основные компоненты процесса исследования. На рис.3.6 изображены их взаимоотношения друг с другом. Операционализация понятий посредством разработки измеряемых показателей готовит нас к работе с материалом, в ходе которой мы будем делать наблюдения, ложащиеся в основание наших выводов. Однако для того, чтобы осуществить эти наблюдения, нам понадобится “план наступления” – такая схема проведения наблюдений, которая позволит сделать на их основе максимальное количество надежных выводов. Такой план, или программа исследования, является темой гл. 4. [c.116]

4-лекция. РАБОТА ПО ПЛАНУ: КАК СОСТАВИТЬ ПРОГРАММУ ИССЛЕДОВАНИЯ

Ни один опытный альпинист даже и помыслить не может о том, чтобы совершить восхождение на Эверест, не проделав большой предварительной работы по планированию, которая должна гарантировать соответствующую экипировку, выбор наилучшего маршрута и наличие информации о том, что делать в случае каких-то непредвиденных обстоятельств. Точно так же социологи не спешат браться за крупный исследовательский проект без тщательного планирования тех шагов, которые они должны будут предпринять. Этот “план наступления” называется программой исследования. “Программа исследования – схема, лежащая в основе процесса сбора, анализа и интерпретации данных. Это логическая модель доказательства, позволяющая делать валидные каузальные выводы”¹. Если нет адекватной и подходящей для данного случая программы исследования, лучшие измерения окажутся бесполезными, поскольку нельзя будет определить их значение. Разработка надежных программ исследования, как и другие обсуждавшиеся нами проблемы исследовательского мастерства, – важный фактор успешного развития социальных наук.

Прежде чем предпринять любое серьезное исследование, следует составить его программу, которая не только в точности описывает, что и как вы собираетесь делать, но и объясняет, почему вы совершаете каждый данный шаг и почему вы совершаете его именно так, а не иначе. [c.118]

ЦЕЛЬ И ПРОГРАММА ИССЛЕДОВАНИЯ

Вплоть до настоящего момента мы обсуждали политологическое исследование так, как если бы оно было полностью предназначено для проверки гипотез с помощью процесса, изображенного на рис.3.6. И хотя проверка гипотез обычно считается наиболее важной во всех социальных науках, исследование, вообще говоря, может иметь множество целей, и его программа, [c.118] максимально подходящая для любого данного проекта, будет зависеть от его цели². Некоторые исследовательские проекты являются поисковыми. Они предназначены для того, чтобы поближе познакомить нас с явлениями, которые мы собираемся исследовать, дать возможность более точно сформулировать проблемы и, быть может, построить гипотезы. Такие исследования могут играть важную роль, когда изучаются новые явления или явления, которые ранее не изучались. Некоторые проекты включают в свой состав описательные исследования. Последние предназначены для того, чтобы дать точное представление о некоторых явлениях, позволяющее нам лучше сформулировать проблемы и гипотезы. Например, прежде чем мы начнем строить теорию возможных причин некоторого явления, нам могут понадобиться сведения о частоте, географическом распределении и последовательности событий в составе данного явления или о том, с какими иными явлениями, как правило, ассоциируется данное явление. И наконец, исследование может быть предназначено для проверки каузальных гипотез. Если результаты исследования можно использовать для подтверждения того, что одно явление вызывает другое, можно попытаться дать объяснение этому другому явлению. Поэтому исследование, проверяющее гипотезы, может быть названо объяснительным исследованием. Такое исследование подходит тогда, когда мы уже достаточно знаем о явлении, чтобы начать искать объяснение того, почему данное явление таково, каково оно есть.

Данная предварительная типология целей исследования удобна потому, что исследование каждого типа предполагает свою программу. Поисковое исследование требует скорее гибкости, чем точности, поскольку его цель – выявить возможные, а не проверить гипотетические объяснения. Программы поискового исследования должны давать лишь возможность наблюдать соответствующее явление. А вот описательное исследование требует точного измерения явлений. В описательных исследованиях (если мы надеемся получить точную картину интересующих нас событий) программа призвана обеспечивать беспристрастность и надежность наблюдений. Программы объяснительных исследований должны не только обеспечивать беспристрастное и надежное наблюдение, но и [c.119] давать возможность делать выводы относительно причинного воздействия переменных друг на друга. Программа исследования дает возможность делать каузальные выводы, если она позволяет исключить любые правдоподобные объяснения наблюдаемых фактов, являющиеся альтернативными по отношению к проверяемой каузальной гипотезе.

Вне зависимости от конкретной цели исследования программа исследования должна включать следующие основные элементы:

1) изложение цели исследования;
2) изложение гипотезы, подлежащей проверке (если таковая имеется);
3) спецификацию используемых переменных;
4) изложение способа операционализации и измерения каждой переменной;
5) детальное описание организации и проведения наблюдений;
6) обобщающее обсуждение будущего анализа собранных данных.

Главы 2 и 3 дают необходимые сведения относительно пунктов программы (1) – (4); гл. 12–16 освещают проблему анализа данных. Настоящая глава посвящена организации наблюдений. Именно этот аспект программы исследования дает основания для исключения альтернативных конкурирующих гипотез, и именно его имеет в виду большинство исследователей, когда идет речь о программе исследования. [c.120]

УЧЕТ В ПРОГРАММЕ ИССЛЕДОВАНИЯ АЛЬТЕРНАТИВНЫХ КОНКУРИРУЮЩИХ ГИПОТЕЗ

На примере гипотетической программы исследования можно продемонстрировать воздействие способа структурирования или организации наших наблюдений на степень полезности результатов. Представьте себе, что департамент юстиции какого-то американского штата осуществил новую программу, направленную на сокращение детской преступности. В программу входит однодневное пребывание в тюрьме малолетних преступников и тех, кто потенциально может стать преступником; во время этого пребывания они получают некоторое представление об [c.120] ужасах тюремной жизни. Программа основана на предположении, что этот опыт отобьет у них охоту совершать преступления, которые могут повлечь за собой тюремное заключение. Предположим, после того как программа осуществлялась в течение нескольких месяцев, администрация штата хочет узнать, имела ли она желаемый эффект, и предлагает вам, опытному политологу, оценить ее результаты. Что вы предпримете для этого?

Поскольку программа, известная под названием “операции по устрашению”, предназначена для сокращения детской преступности, преступность и будет зависимой переменной. Можно операционализировать ее как быть арестованным за совершение уголовного преступления и далее просто проконтролировать регистрацию приводов в течение года после посещения тюрьмы тех молодых людей, которые прошли через “операцию по устрашению”. Если в течение года они подверглись аресту, вы считаете их правонарушителями. Если они не были арестованы, вы не считаете их правонарушителями³.

Ваша программа исследования в данном случае предполагает всего лишь наблюдение за всеми представляющими интерес объектами. Это наблюдение вы проводите, просматривая регистрацию приводов лиц, прошедших через “операцию по устрашению”. Положим, вы обнаружили, что 70% участвовавших в программе не подверглись аресту в течение следующего года. Можете ли вы на этом основании сделать вывод, что эффективность программы по предотвращению преступности – 70%?

Для того чтобы сколько-нибудь надежно сделать такой вывод, вам необходимо исключить другие объяснения того, почему 70% этих молодых людей не были арестованы. Ваша рабочая гипотеза заключается в том, что опыт, полученный входе “операции по устрашению”, предотвращает правонарушения. Рассмотрим некоторые возможные альтернативные конкурирующие гипотезы, способные объяснить полученные результаты.

1. Даже если бы “операция по устрашению” не проводилась, арестовано было бы не более 30% молодых людей.

2. У лиц, добровольно принявших участие в “операции по устрашению”, иная семейная обстановка, чем у тех, кто в ней не участвовал, и именно эта обстановка, а не организованная [c.121] штатом программа предотвратила совершение правонарушений.

3. Молодые люди совершали преступления, но не попадались.

4. Хотя “операция по устрашению” может дать временный эффект, постепенно он сойдет на нет, и молодежь снова будет совершать преступления (т.е. программа скорее отсрочивает, нежели предотвращает, совершение преступлений).

5. Молодые люди, участвовавшие в программе, арестовывались чаще, чем если бы они не принимали участия в “операции по устрашению”, поскольку участие в ней навешивало на них ярлык потенциальных преступников и делало их объектом более пристального внимания со стороны полиции (т. е. программа способствует увеличению количества арестов вне всякой связи с ее воздействием на поведение).

Альтернативная гипотеза (1), по существу, утверждает, что программа не оказывает никакого воздействия. Располагая только имеющимися наблюдениями, вы не можете показать, так это или нет. Вы никогда не узнаете, как поступили бы те, кто участвовал в программе, если бы они не приняли участия в “операции по устрашению”, однако вы можете включить в программу исследования просмотр регистрации приводов для группы молодых людей, не прошедших через указанную операцию, но во всех остальных отношениях максимально сходных с теми, кто через нее прошел. Затем вы можете сравнить степень преступности участвовавших и не участвовавших в программе и утверждать, что различия между этими показателями обусловлены влиянием программы, поскольку мы можем считать, что участники программы действовали бы так же, как их сверстники, не охваченные “операцией по устрашению”.

Наблюдение за контрольной группой (за теми, кто не участвует в программе) позволяет нам установить причинную связь между участием в программе и преступным поведением.

Альтернативная гипотеза (2) заключается в том, что представляющееся очевидным отношение между участием в программе и преступным поведением является мнимым. Гипотеза утверждает, что обстановка в семье является [c.122] причиной и участия в программе, и последующего отсутствия правонарушений. Такое рассуждение предполагает, что существует процесс отбора, при котором те, кто имеет в семье поддержку, помогающую не совершать преступления, и те, кто, скорее всего, примет участие в программе,– одни и те же люди, и что это создает очевидную связь между “операцией по устрашению” и отсутствием преступлений.

Одно лишь наблюдение не позволит вам исключить эту возможность, однако наличие контрольной группы, включающей молодых людей, условия жизни которых сходны с условиями жизни тех, кто был вовлечен в “операцию по устрашению” – как и в случае гипотезы (1), – позволяет определить, так ли это. Вы можете проверить, чтобы убедиться, действительно ли участвовавшие и не участвовавшие в программе, как правило, имеют различные семейные условия, а те, кто имеет одинаковые семейные условия, имеет, как правило, одинаковый показатель преступности вне зависимости от участия в операции.

Исключение гипотезы (2), как и работа с гипотезой (1), требует проведения второго наблюдения (проверки регистрации приводов некоторых молодых людей, не участвующих в программе). Однако, помимо этого, проработка гипотезы (2) потребует от вас проведения еще одного наблюдения, в ходе которого будут собраны данные о семейной обстановке объектов наблюдения. Возможно, вы получите некоторые объективные показатели этой переменной (например, наличие обоих родителей, уровень образования и род занятий родителей, доход семьи) из официальных документов, но, быть может, вам придется также провести интервью с членами семьи или самими молодыми людьми. Если вы операционализируете обстановку в семье с учетом отношений и личных взаимосвязей, такие интервью будут крайне необходимы. Вы, таким образом, не только увеличиваете объем данных, но и используете другой метод сбора материала – личное интервью.

Альтернативная гипотеза (3) еще в большей степени нуждается в таком дополнительном методе сбора данных. В соответствии с этой гипотезой выдвигается предположение, что “операция по устрашению” сделала своих участников более осторожными и, быть может, [c.123] даже более хитрыми преступниками, а не уменьшила количество совершаемых ими преступлений. Гипотеза ставит под сомнение адекватность операционализации зависимой переменной. Пока единственной мерой преступности является официальная регистрация арестов, вы не можете быть уверены в том, что ваши сомнения напрасны.

Один из способов проработки гипотезы (3) состоит в том, чтобы включать в операционализацию преступности сообщения о преступных действиях, полученные от самих несовершеннолетних, и проводить интервью до и после прохождения программы. Вам придется проводить интервью и с участвующими и с не участвующими в программе и для каждой группы включать информацию о семейной обстановке, для того чтобы обрести уверенность, что ваши результаты нельзя объяснить с помощью гипотез типа (1) и (2), сформулированных в терминах этого нового показателя преступности. Поступив таким образом, вы ввели не только новый момент наблюдения (предваряющее программу интервью), но и другой способ операционализации зависимой переменной.

Альтернативная гипотеза (4) вводит в исследование ось времени. Если вам нужно ее учитывать, придется проводить интервью и проверять регистрации преступлений как для участников программы, так и для контрольной группы не только через год после посещения тюрьмы, но и через два, а возможно, и через три года. Причина проведения последующих наблюдений за участниками программы должна быть очевидна, поскольку гипотеза (4) утверждает, что при определенных обстоятельствах участники программы становятся преступниками. Но необходимо также пронаблюдать и за контрольной группой, чтобы убедиться, что изменения показателей преступности участников программы в последующие годы не являются результатом воздействия других факторов, таких, как взросление, изменение семейных условий или ухудшение материального положения. Только в том случае, если в последующие годы показатели преступности у участников программы оказываются близкими к показателям преступности для неучастников на тот же момент времени (или даже более плохими), вы [c.124] можете сделать вывод, что программа оказалась неэффективной (или что она имела отрицательный эффект).

В отличие от остальных гипотез альтернативная гипотеза (5) утверждает, что “операция по устрашению” была более эффективной, чем позволяют считать ваши результаты. Она выдвигает предположение, что, используя в качестве меры преступности аресты, вы ввели дополнительную независимую переменную (избирательное отношение со стороны властей), воздействие которой перекрывает реальное воздействие операции на преступное поведение.

Один из способов учесть эту возможность – ввести другую операционализацию зависимой переменной. Если принимать во внимание не только арест, но и осуждение как в случае участвующих, так и в случае не участвующих в программе, вы будете располагать данными о том, являются ли дела, возбуждаемые против участников программы, менее обоснованными, чем дела тех, кто не проходил через нее; исходя их этого вы сможете сделать вывод, имеется ли со стороны полиции тенденция чаще арестовывать добровольных участников “операции по устрашению”. Разница между числом арестов и числом осуждений для участников и для неучастников будет показателем избирательности внимания со стороны полиции. Если участников программы арестовывают, не предавая в конечном итоге суду или не осуждая, существенно чаще, чем неучастников, у вас есть основания считать, что гипотеза (5) верна.

Этот краткий обзор нескольких возможных конкурирующих гипотез, способных поставить под сомнение ценность полученных результатов, позволяет разработать более детальную программу исследования, чем та, что предлагалась вначале. Если вы хотите получить возможность исключить те пять альтернативных интерпретаций результатов, полученных в ходе вашего исследования (а вы должны это сделать, чтобы ваше исследование имело какой-то смысл), вам придется перейти от одной-единственной операционализации зависимой переменной и от одного-единственного наблюдения к программе, включающей множество способов операционализации, множество методов сбора [c.125] данных и несколько наблюдений. Такая новая программа должна включать следующие основные этапы:

1. Сформировать выборку из числа несовершеннолетних, которые отобраны для участия в “операции по устрашению”, и выборку из числа несовершеннолетних, которые имеют тот же состав характеристик, релевантных с точки зрения преступности (например, пол, возраст, расовая принадлежность, род занятий, образование и доход родителей, жизненные условия и место жительства), но которые не должны участвовать в программе.

2. Взять интервью у испытуемых, предназначенных для включения в программу, до того, как они примут участие в операции, и одновременно взять интервью у контрольной группы, чтобы получить самоотчеты о преступной деятельности и информацию об обстановке в семье.

3. Взять интервью у членов семей всех испытуемых, чтобы получить информацию об обстановке в семье.

4. Через год после того, как испытуемые посетили тюрьму, взять интервью как у участников, так и у неучастников программы, чтобы получить самоответы о преступной деятельности и выяснить, не изменились ли их семейные условия.

5. Во время осуществления этапа (4) сравнить данные по арестам и осуждениям для участников и неучастников программы.

6. Через два года после участия испытуемых в “операции по устрашению” повторить этапы (4) и (5).

7. Через три года после операции повторить этапы (4) и (5).

Анализируя данные, вы захотите сравнить количество арестов, количество осуждений и различия между количеством арестов и количеством осуждений для участников программы и контрольной группы; при этом необходимо внимательно следить за тем, чтобы исключать из контрольной группы тех ее членов, которые, будучи вначале отобранными для исследования, приняли затем участие в “операции по устрашению”. Используя при анализе данных, полученных в ходе этих наблюдений, подходящие статистические процедуры, вы должны суметь получить в высшей степени надежные выводы о ценности операции как средства, противодействующего преступности малолетних. Благодаря вашему умению исключить основные [c.126] конкурирующие гипотезы департамент юстиции штата сумеет вполне довериться вашим выводам, чего никак не могло бы случиться, если бы эти выводы основывались на первой программе исследования.

Цель этого упражнения состоит не в том, чтобы констатировать преимущество сложных программ исследования над простыми. Иногда простая программа гораздо предпочтительнее. Важным фактором является адекватность программы, а не ее сложность. Если программа дает логическое основание для тех типов выводов, которые хочет получить исследователь, она является адекватной.

Обсуждение этого гипотетического исследования можно рассматривать как пример разработки адекватных программ. Составляя план для исследовательского проекта, вы следуете тому же ходу рассуждений, который мы наметили. Программа исследования – это процесс формулирования альтернативных конкурирующих гипотез и продумывания, какого рода наблюдения необходимы для проверки этих гипотез, так чтобы их нельзя было рассматривать в качестве объяснений возможных результатов.

Альтернативные конкурирующие гипотезы обнаруживаются так же, как и рабочие гипотезы. Они возникают в результате логического анализа теорий, касающихся событий, которые мы пытаемся объяснить. Действительную альтернативу составляет конкурирующая (соперничающая) гипотеза, предлагающая такие же взаимоотношения, как и наша основная гипотеза, но объясняющая их с точки зрения отличного причинно-следственного процесса. Важно не смешивать действительно альтернативную конкурирующую гипотезу с тем, что мы можем назвать “другие гипотезы”. Благодаря существованию множественности причинных связей в социальных явлениях очень часто мы сталкиваемся с тем, что любому явлению может быть найдено множество равно достоверных объяснений. Устанавливая другую причину изучаемых отношений, мы можем выдвинуть просто иную гипотезу, которая, возможно, ни в меньшей степени не будет конкурирующей с основной. Гипотеза является альтернативной конкурирующей гипотезой только [c.127] тогда, когда логически невозможно доказать, что и она, и основная гипотеза являются достоверными.

Выдвижение критической конкурирующей гипотезы – это преимущественно творческий процесс⁴. Не существует точных и строгих правил, гарантирующих установление всех конкурирующих гипотез, способных поставить под сомнение ценность вашего исследования. Процесс разработки программы для исследовательского проекта индивидуален для каждого исследования. Вы не можете просто выбрать подходящую программу из ограниченного набора альтернатив, как могли бы выбрать в обувном магазине пару туфель на полке с вашим размером. Существует, однако, несколько общих типов программ исследования, каждый из которых удобен для работы с определенной проблемой. Следующий раздел содержит обзор основных типов программ и введение в логику планирования исследования. Имея такую базу и разумное теоретическое и эмпирическое представление о соответствующем объекте, вы будете в состоянии разрабатывать собственные программы. [c.128]

ЭКСПЕРИМЕНТАЛЬНЫЕ ПРОГРАММЫ ИССЛЕДОВАНИЯ

Цель хорошей программы – дать возможность с максимально возможной степенью уверенности определить результаты воздействия одной переменной на другую. Программы исследования позволяют сделать это, давая возможность в некоторой степени контролировать условия, в которых взаимодействуют переменные. Такой контроль – ключевое понятие для программы. Если после добавления в рацион животных новых кормов какие-то животные на ферме заболевают, фермер не может быть уверен, что причиной болезни являются именно новые корма, так как в то же самое время животные могли пострадать от многих других факторов (например, инсектицидов в питьевой воде). С другой стороны, если в медицинской исследовательской лаборатории обнаруживается, что после введения в рацион новых кормов заболевает необычно большой процент наблюдаемых животных, исследователь скорее может быть уверен, что причина [c.128] болезни – новые корма, поскольку в этой ситуации имеется возможность контролировать условия содержания исследуемых животных и гарантировать, что в процессе наблюдения они не подвергаются воздействию никаких других новых факторов. Обстановка, в которой работает исследователь, в отличие от условий фермы дает возможность частичного контроля.

Программы исследования можно классифицировать по степени контроля, который они обеспечивают. Основное различие, интересное для политолога, – это различие между экспериментальными и квазиэкспериментальными программами.

Эксперимент – классический способ научного доказательства. Он основан на предположении, что изменения в значении одной переменной вызывают изменения в значении другой переменной (например, изменения температуры вызывают изменения вязкости масла). Эксперимент позволяет нам проверить это предположение, подвергнув объекты, обнаруживающие зависимую переменную, воздействию независимой переменной в условиях, дающих нам определенную уверенность в том, что любое наблюдаемое изменение зависимой переменной является результатом изменений независимой переменной.

Для элементарной экспериментальной программы исследования требуется экспериментальная группа, состоящая из лиц, которые будут подвергнуты воздействию независимой переменной, или стимула, и контрольная группа лиц, которые сходны с экспериментальной группой во всех существенных аспектах, но не будут подвергаться воздействию стимула. Значение зависимой переменной в каждой группе измеряется до начала воздействия стимула в ходе так называемого предварительного тестирования (pretest) и затем еще раз после того, как экспериментальная группа подверглась воздействию стимула, в ходе контрольного тестирования (posttest). Вывод о влиянии стимула (независимой переменной) делается на основании сравнения оценок предварительного теста и контрольного теста для каждой группы. Чем больше различие в значениях между предварительным тестом и контрольным тестом в каждой группе, тем большее влияние приписывается независимой переменной. В [c.129] табл.4.1 изображена логическая структура экспериментальной программы исследования. Значение этой исследовательской программы состоит в том, что она позволяет достичь двух условий, облегчающих получение валидных каузальных выводов: сравнения и управления.

Таблица 4.1

Программа классического эксперимента

Группа	Момент времени 1	Момент времени 2	Момент времени 3	Формула результата
Экспериментальная	Предварительный тест	Стимул	Контрольный тест	Результат (для экспериментальной переменной) = (контрольный тест э – предварительный тест э) – (контрольный тест к – предварительный тест к), где э – экспериментальная группа, к – контрольная группа
Контрольная	Предварительный тест	–	Контрольный тест

Утверждение о том, что одно явление явилось причиной другого, основывается на понятии изменения. Прежде чем утверждать, что имело место причинное воздействие, мы должны быть в состоянии продемонстрировать, что произошло некоторое изменение, а понятие изменения предполагает сравнение. Мы должны иметь возможность сравнивать значения зависимой переменной до того, как исследуемые объекты были подвергнуты воздействию независимой или каузальной переменной со значениями зависимой переменной после такого воздействия; и кроме того, если это возможно, следует сравнить значения зависимой переменной после воздействия с некоторым показателем, задающим эти значения в отсутствие какого бы то ни было воздействия. Экспериментальная программа, с ее процедурой предварительного – контрольного – тестирования, с ее экспериментальной и контрольной группами, создает условия для сравнений обоих типов.

Чтобы обрести уверенность, что одна переменная оказывает причинное воздействие на другую, мы должны [c.130] располагать информацией, кто из обследуемых подвергался воздействию независимой переменной, а кто нет, так чтобы мы могли сделать необходимые сравнения. Классический эксперимент дает такую информацию, так как независимую переменную вводит сам исследователь. Ученый управляет обстановкой, окружающей обследуемых, так что причинное воздействие происходит не по воле случая. Кроме того, исследователь контролирует обстановку таким образом, чтобы гарантировать, что все другие возможные причины изменения зависимой переменной в течение времени воздействия независимой переменной на объекты исследования из эксперимента устранены.

Многие другие программы основаны на логической структуре классического эксперимента, однако в них имеются модификации, предназначенные специально для ученых. Их потребность в более тщательно разработанных программах в значительной степени объясняется тем, что (1) часто на объекты их исследования оказывает влияние сам процесс исследования (например, поведение людей может меняться, если они знают, что за ними наблюдают) и (2) объекты их исследования не статичны, а постоянно меняются (например, оценки людей могут варьироваться в зависимости от ситуации). Возможности учета этих фактов иллюстрируются на примере двух экспериментальных программ, разработанных Р.Л.Соломоном⁵.

Первая программа нацелена на один из аспектов проблемы реактивности – так называемый тест-эффект. Когда объекты эксперимента подвергаются предварительному тестированию, всегда существует возможность, что их оценка в контрольном тесте будет складываться как из реакции на стимул, так и из реакции на сам предварительный тест. Любое различие между оценками предварительного и контрольного тестов, возникающее исключительно в результате реакции на предварительный тест, известно под названием тест-эффекта. Если нам необходимо получить точную картину воздействия стимула на поведение, мы должны уметь удалять из оценок этот тест-эффект. Сделать это позволяет предложенная Р.Соломоном программа исследования с двумя контрольными группами, представленная в табл. 4.2. [c.131]

Таблица 4.2

Программа эксперимента с двумя контрольными группами, разработанная Р.Соломоном

Группа	Момент времени 1	Момент времени 2	Момент времени 3	Формула результата
Экспериментальная	Предварительный тест	Стимул	Контрольный тест	Результат = [(контрольный тест э – предварительный тест э) – (контрольный тест к1 – предварительный тест к1)] – (контрольный тест э – контрольный тест к2)
Контрольная 1	Предварительный тест	–	Контрольный тест
Контрольная 2	–	Стимул	Контрольный тест

Программа почти такая же, как в классическом эксперименте, различие состоит только в том, что добавлена третья группа. В третьей группе (контрольной группе 2) есть стимул и есть контрольный тест, но нет предварительного теста. В то время как различия между оценками предварительного и контрольного тестов в экспериментальной группе могут быть обязаны своим происхождением и предварительному тесту, и стимулу, те же самые различия в контрольной группе 1 могут возникать только под воздействием предварительного теста, а в контрольной группе 2 – только под воздействием стимула. Если мы вправе предположить, что первоначально значение зависимой переменной во всех группах фактически одно и то же и что группы прореагировали на стимул одним и тем же образом, то различие между оценками контрольного теста в экспериментальной группе и оценками контрольного теста в контрольной группе 2 и будет демонстрировать тест-эффект. Тогда воздействие самой независимой переменной (стимула) можно измерить, вычтя тест-эффект из общего результата эксперимента (последний подсчитывается по той же формуле, которая используется для оценки результатов программы классического эксперимента). Формула результата в табл. 4.2 представляет это рассуждение в алгебраическом виде.

Итак, программа с двумя контрольными группами позволяет нам оценить и, как мы надеемся, исключить тест-эффект как альтернативное объяснение наблюдаемых изменений в оценках испытуемых. Существуют, однако, другие возможные причины изменения оценок [c.132] зависимой переменной в группах в контрольном тесте по сравнению с предварительным. Одна из причин – воздействие внешних факторов, находящихся вне контроля экспериментатора. Другая причина – естественные изменения, происходящие с испытуемыми вне связи с экспериментом (такие, как старение, изменения в ходе длительных экспериментов или умственное утомление). Воздействие таких посторонних факторов можно оценить (и тем самым исключить в качестве конкурирующего объяснения результатов эксперимента), используя программу Р. Соломона с тремя контрольными группами (см. табл. 4.3).

Таблица 4.2

Программа эксперимента с двумя контрольными группами, разработанная Р.Соломоном

Группа	Момент времени 1	Момент времени 2	Момент времени 3	Формула результата
Экспериментальная	Предварительный тест	Стимул	Контрольный тест	Результат = [(контрольный тест э – предварительный тест э) – (контрольный тест к1 – предварительный тест к1)] – [(контрольный тест к2) + (контрольный тест э – контрольный тест к3)]
Контрольная 1	Предварительный тест	–	Контрольный тест
Контрольная 2	–	Стимул	Контрольный тест
Контрольная 3	–	–	Контрольный тест

В этой программе добавлена третья контрольная группа, не получающая ни предварительного теста, ни стимула. Любое различие между оценками предварительного и контрольного тестов в этой группе может возникать только за счет влияния посторонних факторов. Если мы способны вычесть это различие из результата эксперимента, значит, мы способны устранить результаты воздействия посторонних факторов и изменения, которые происходят в результате такого воздействия у испытуемых; и мы можем надеяться исключить альтернативную гипотезу, состоящую в том, что именно эти воздействия, а не независимая переменная были причиной изменения оценки в экспериментальной группе от момента 1 до момента 3. [c.133]

Трудность состоит в том, что контрольная группа 3 не подвергалась предварительному тесту. Как же определить, насколько изменились оценки этих испытуемых с момента 1 до момента 2? Если все наши группы в основном сходны между собой, мы можем считать, что их оценки в предварительном тесте должны были быть очень близки, и просто приписать контрольной группе 3 в предварительном тесте оценку, равную усредненным оценкам экспериментальной и первой контрольной групп. Тогда мы можем вычесть эту оценку из оценки контрольной группы 3 в контрольном тесте, чтобы получить меру изменения, возникающего вследствие воздействия посторонних факторов и естественных изменений, происходящих с испытуемыми. Устранив и это изменение, мы можем более отчетливо увидеть результаты воздействия независимой переменной на зависимую. [c.134]

ФОРМИРОВАНИЕ ГРУПП

Каждая из только что описанных программ эксперимента предназначена для того, чтобы предоставить надежный логический базис для осуществления выводов относительно влияния одной переменной на другую. Чтобы преуспеть в этом, каждая программа опирается на предположение, что все группы, участвующие в исследовании, в основном одинаковы с точки зрения факторов, которые могли бы повлиять на результат эксперимента. Если мы почему-либо не можем считать, что группы в основном одинаковы, у нас нет логического основания для вывода о том, что наблюдаемые различия в оценках групп возникают вследствие разного обращения с группами в процессе эксперимента (например, в зависимости от того, подвергались ли они предварительному тестированию), и мы не можем привести убедительные доводы относительно причинного воздействия независимой переменной.

Как фактически добиться устранения различий между членами разных групп? Существует три подхода к формированию групп. Во-первых, это точный подбор соответствий. Определив, какие характеристики могли бы оказать воздействие на реакцию испытуемых в отношении независимой переменной, мы отбираем для эксперимента ряд испытуемых. Для каждого выбранного испытуемого в состав контрольной группы подбирается другой испытуемый, [c.134] имеющий то же самое сочетание релевантных характеристик. В результате возникает две группы, тождественные с точки зрения характеристик, которые могли бы повлиять на их реакцию в эксперименте. В идеале их оценки в предварительном тесте должны быть очень близки, и мы можем использовать степень близости, реально установленную в ходе предварительного теста, чтобы оценить свои усилия по достижению соответствия.

В связи с этой процедурой возникает ряд проблем. Во-первых, если нам необходимо контролировать большое число характеристик, может оказаться крайне трудно выбрать испытуемых, в точности соответствующих всем этим характеристикам (как это требуется при подборе соответствий). Например, мы могли бы найти людей, одинаковых с точки зрения пола, возраста и расовой принадлежности, но оказаться не в состоянии подобрать их так, чтобы они обладали всеми этими характеристиками и при этом имели одинаковую профессию, уровень образования и одинаково долго жили в данном сообществе. Кроме того, если мы хотим применить программу исследования, предусматривающую наличие более чем двух групп, может оказаться чрезвычайно трудно найти трех или четырех испытуемых с одинаковыми характеристиками. Если только мы не располагаем очень большим фондом потенциальных испытуемых или не имеем дело с самым простым экспериментом, подбор соответствий как способ распределения испытуемых по экспериментальным группам может оказаться невозможным.

Второй метод – метод контроля за частотным распределением. В этом случае мы не проводим сопоставление каждого испытуемого с каким-либо другим по всем характеристикам. Вместо этого испытуемые распределяются по группам таким образом, чтобы было гарантировано наличие в каждой группе одних и тех же средних характеристик и одинаковое распределение каждой характеристики. Может так случиться, что не найдется двух испытуемых с одинаковым набором характеристик пола, возраста, расовой принадлежности и профессии, однако каждая группа будет характеризоваться одним и тем же количеством мужчин и женщин, одинаковым средним возрастом и т. п. Более того, группы будут характеризоваться очень близким распределением этих характеристик среди их членов. [c.135]

Контроль за распределением частот практикуется чаще, чем точный подбор соответствий, однако у него есть два существенных недостатка. Во-первых, он позволяет одновременно контролировать только одну переменную. Пользуясь методом распределения частот, можно, например, получить две группы с одинаковым количеством испытуемых в возрасте старше 40 лет и одинаковым количеством чернокожих граждан, однако нет никакой гарантии, что все испытуемые старше 40 лет не окажутся неграми в одной группе и белыми в другой. Если именно так и случится, две группы в действительности не будут сходными. Во-вторых, данный метод не дает возможности контролировать факторы, которые воздействуют на реакции испытуемых, но не были выделены исследователем. Если наша теория неполна (а она почти всегда неполна), мы могли не установить контроль за частотным распределением некоторой важной переменной. Если окажется так, что контрольная и экспериментальная группа систематически различаются по этой неконтролируемой переменной, могут быть получены искаженные результаты.

Третий метод формирования групп более гибок по сравнению с точным подбором соответствий. Это метод рандомизации. Испытуемый, выбранный из списка всех подходящих испытуемых, включается в группу посредством некоторого случайного процесса, например с помощью таблицы случайных чисел. Настоящая рандомизация не может быть достигнута с помощью процедур, имеющих случайный характер (вроде того, чтобы отобрать первых 30 человек, выразивших желание участвовать в эксперименте, в экспериментальную группу, а следующих 30 – в контрольную).

Рандомизация имеет большое преимущество, создавая у нас чувство уверенности, что все наши группы сходны между собой во всех отношениях, а не только с точки зрения переменных, которые мы считаем релевантными для эксперимента, поскольку при отборе большого числа испытуемых случайное распределение по группам гарантирует нейтрализацию различий между испытуемыми. Таким образом, рандомизация позволяет исключить любую альтернативную конкурирующую гипотезу, утверждающую, что наблюдаемые результаты объясняются какими-то систематическими различиями между группами, она [c.136] является ключом к успешным лабораторным экспериментам. Детально процедуры случайного выбора объектов обсуждаются в гл.5. [c.137]

ПОЛЕВЫЕ ЭКСПЕРИМЕНТЫ И НЕЭКСПЕРИМЕНТАЛЬНЫЕ ПРОГРАММЫ

Политологи по характеру своей деятельности редко работают в лабораториях. Они скорее наблюдают события в естественной обстановке, где меньше возможности контролировать факторы, которые могли бы повлиять на результаты исследования. В тех случаях, когда исследователи могут управлять независимой переменной и контролировать реакцию испытуемых, но не в состоянии контролировать другие аспекты ситуации, они могут проводить полевые эксперименты. В этих исследованиях используется экспериментальная программа, в которой испытуемые систематически распределяются на экспериментальную и контрольную группы. Примерами полевых экспериментов являются различные эксперименты по “отрицательному подоходному налогу”, проводимые в США⁶. Эти исследования использовались для измерения воздействия автоматических благотворительных выплат в форме отрицательного подоходного налога на образ жизни и усердие в работе, характеризующие испытуемых. Исследователи могли контролировать, кто из испытуемых получил выплаты в виде отрицательного подоходного налога, но они не могли проконтролировать другие релевантные аспекты ситуаций, в которых находились испытуемые. Например, исследователи не могут гарантировать сохранение здоровья и семейного статуса испытуемого или возможность получить работу в данном месте. Такое положение создавало трудности при отделении воздействия благотворительных выплат от других возможных причин изменений в поведении испытуемых, однако оно имело явные преимущества, позволяя осуществить проверку воздействия отрицательного подходного налога на практике. Лабораторный эксперимент, даже если бы его можно было организовать, не был бы столь же успешным, так как нельзя быть уверенным, что результаты, полученные в таких искусственных условиях, точно отражают то, что происходит в окружающем мире. И это – главное преимущество [c.137] полевых экспериментов перед лабораторными исследованиями.

В полевых экспериментах исследователи с большой тщательностью подбирают испытуемых и осуществляют случайное распределение на экспериментальную и контрольную группы, чтобы хоть как-то контролировать фоновые характеристики, которые могут воздействовать на результаты. Они также внимательно следят за условиями, в которых находятся испытуемые на протяжении эксперимента, чтобы исключить альтернативные гипотезы, которые соотносят наблюдаемые результаты с внешними событиями, происходящими во время эксперимента. (Например, все те испытуемые, которые по состоянию здоровья оказывались неспособны работать, исключались из эксперимента по отрицательному подоходному налогу, так чтобы их безработное состояние нельзя было интерпретировать как реакцию на благотворительные выплаты.)

Во многих случаях политологи не в состоянии управлять даже независимой переменной. Вы вполне можете представить себе, насколько трудно убедить одни народы совершить революцию, а других повременить с ней, чтобы провести полевой эксперимент по воздействию революций на политическое развитие! Чем сложнее исследуемый объект, тем меньше вероятность, что мы сможем контролировать его. В этих условиях исследователи должны попытаться приблизиться к экспериментальной программе, как будет описано в следующем разделе, или же обратиться к неэкспериментальной программе.

В неэкспериментальных исследованиях ученые не в состоянии контролировать ни распределение испытуемых по экспериментальным группам, ни распространение независимой переменной, не могут они получить и предварительные оценки для зависимой переменной. Они могут быть вынуждены использовать то, что называют программой постфактум, в которой одно-единственное наблюдение осуществляется после того, как произошло предполагаемое каузальное событие. Иногда может добавляться “контрольная группа” сходных испытуемых, не подвергавшихся воздействию независимой переменной, и различия в оценках двух групп связываются с воздействием независимой переменной. Однако такие программы не позволяют делать надежные выводы относительно [c.138] воздействия независимой переменной, так как не дают возможности исключить даже самые простые альтернативные гипотезы. Например, мы не можем быть уверены даже в том, что значение зависимой переменной, наблюдаемое после воздействия независимой переменной, хоть в какой-то степени отличается от значения зависимой переменной до этого воздействия. Неэкспериментальные программы подходят только для описательных или поисковых, а не для объяснительных исследований. [c.139]

КВАЗИЭКСПЕРИМЕНТАЛЬНЫЕ ПРОГРАММЫ

Большинство исследовательских программ, используемых политологами, можно определить как квазиэкспериментальные. В этих исследованиях невозможно контролировать воздействие независимой переменной или условия, при которых оно происходит, однако исследователи пытаются имитировать экспериментальную программу, либо собирая дополнительные данные, либо используя методы анализа данных. Правильно составленные квазиэкспериментальные программы дают такую возможность, как если бы были использованы все контрольные характеристики настоящего эксперимента; они являются надежной логической основой для получения причинных выводов.

Возможно, наиболее простым типом квазиэкспериментальных программ в политологии является эксперимент ех post facto. В ходе этого эксперимента исследователи осуществляют одно наблюдение и собирают данные о независимой и зависимой переменных и обо всех других переменных, которые, по их мнению, следует контролировать. Если, например, мы хотим изучить воздействие высшего образования на поведение избирателей, мы можем провести исследование на случайно выбранных испытуемых. Затем мы анализируем наши данные, чтобы определить, действительно ли люди, сходные в других отношениях (например, сточки зрения расовой принадлежности, пола, возраста, места жительства), но имеющие разный уровень образования, голосуют по-разному. Для этого существуют более тонкие статистические методы, но проще всего рассортировать наших респондентов по таблицам взаимной сопряженности признаков, так чтобы можно было исследовать соотношение между образованием и участием в выборах в разных категориях [c.139] других переменных, рассматривая, например, только женщин или только мужчин, которые посещали или не посещали колледж.

Эта процедура позволяет нам поступать таким образом, как если бы мы, начав эксперимент много лет назад, распределили людей по экспериментальным группам, проанализировали, как воздействует на мотивы их голосования высшее образование (независимая переменная), а потом опять исследовали бы их, чтобы понять, как повлияло образование на их участие в выборах. Члены нашей выборки, не имеющие высшего образования, но в остальных отношениях похожие на тех, кто его имеет, выступают в качестве контрольной группы. Поскольку у нас не было предварительного теста, мы не можем быть уверены, что именно высшее образование явилось причиной всех наблюдаемых отличий в голосовании, но, использовав дополнительные данные, полученные в процессе исследования, мы можем исключить некоторые возможные конкурирующие гипотезы и рассчитывать, что случайное формирование выборки нейтрализует влияние переменных, которые мы не можем проконтролировать при анализе данных.

Бывают ситуации, когда мы не можем воспользоваться случайной выборкой и не можем подобрать сравнимые контрольные группы. Это происходит в том случае, если количество наших единиц анализа невелико или они уникальны с точки зрения многих релевантных аспектов. Примером может служить ситуация, когда городские власти хотят узнать результат воздействия административной реорганизации на стоимость муниципальных услуг. Чтобы ответить на этот вопрос, политологам следует использовать другую распространенную программу, известную как программа измерения временного ряда.

В программах измерения временного ряда исследователь делает несколько наблюдений как до, так и после введения некоторого каузального явления и сравнивает значения зависимой переменной до и после такого введения. В нашем примере политологи могли бы использовать городские архивы для сравнения стоимости муниципальных услуг на душу населения до и после административной реорганизации. (Им придется учитывать расходы на душу населения и следить за инфляцией, чтобы исключить возможность воздействия на эту стоимость увеличившегося населения города [c.140] или роста цен независимо от влияния реорганизации.) Рис.4.1, 4.2, 4.3 иллюстрируют некоторые возможные результаты такого исследования.

В некотором смысле программы измерения временного ряда используют в качестве контрольной группы один и тот же объект (или множество объектов), только на более раннем этапе. Если в динамике значений зависимой переменной до введения независимой переменной имеется некая отчетливая тенденция, мы считаем, что эта тенденция сохранилась бы, не будь независимой переменной; в качестве показателя воздействия независимой переменной мы используем различия между наблюдаемыми значениями зависимой переменной и теми значениями, которые она имела бы в случае сохранения тенденции.

Рис.4.1 иллюстрирует данное рассуждение. Если данные оказываются такими, как представлено на этом рисунке, городские власти с радостью обнаружат, что реорганизация не только уменьшила расходы служб, но также коренным образом изменила тенденцию в направлении устойчивого снижения расходов. Результат воздействия реорганизации в любом данном году может быть измерен в виде разницы между значением, предсказанным для [c.141] данного года на основе первоначальной тенденции, и наблюдаемым значением. Согласно рис.4.1, для 1995 г. результат воздействия реорганизации на расходы служб составляет 50 долларов. Если данные оказываются такими, как показывает рис.4.2, предсказываемые и наблюдаемые значения будут совпадать и можно будет считать, что реорганизация не оказала воздействия на расходы. Рис.4.3 иллюстрирует случай, когда реорганизация вначале уменьшила расходы, но не повлияла на тенденцию. В то время как рис.4.1 демонстрирует, что общий результат реорганизации за четыре года составил 325 долларов, рис.4.3 демонстрирует результат лишь в размере 25 долларов.

В некоторых случаях тенденция, с которой мы имеем дело, не так отчетлива и устойчива, как в данном примере. Пусть, например, городская полиция, озабоченная ростом количества арестов за проституцию, организует кампанию по борьбе с этим явлением и затем хочет узнать, насколько она была успешна. Рис.4.4 демонстрирует, какого рода данные могли быть собраны на протяжении десятилетнего периода. Значения зависимой переменной (аресты за проституцию) [c.142] в разные годы на протяжении указанного периода то возрастают, то уменьшаются. Задача исследователя – определить, есть ли существенное отличие между общей тенденцией, следующей за проведенной кампанией, и общей тенденцией, предшествующей проведению кампании. Один из способов решить эту задачу заключается в сравнении среднегодового количества арестов за проституцию в годы, предшествующие кампании и следующие после нее. (Среднее количество арестов в том и другом случаях равно в данном примере девяти.) Если мы будем считать, что без проведения кампании тенденция осталась бы прежней, то различие между двумя средними значениями можно использовать как показатель воздействия кампании на уровень арестов за проституцию. Другой способ – сравнить линии тенденций (представленные на рис.4.4 пунктирной линией), проходящие через разбросы значений зависимой переменной в период до кампании и после нее, чтобы определить, различаются ли общие тенденции.

Этот пример иллюстрирует одно из важных достоинств программ измерения временного ряда. Если мы отмечаем количество арестов только в 1994 и 1996 гг. (как в типичном [c.143] исследовании “до введения стимула – после введения стимула”), мы можем сделать вывод, что полицейская кампания уменьшила количество арестов за проституцию. Однако данные измерений временного ряда позволяют увидеть, что падение числа арестов с 1994 по 1996 г. – нормальная флуктуация относительно общей тенденции (представленной пунктирной линией), которая остается не затронутой полицейской акцией.

Помимо сильной стороны, программы измерения временных рядов имеют и свою слабую сторону. Во многих случаях у нас нет контрольной группы, и поэтому мы не можем с уверенностью сказать, каковы результаты воздействия независимой переменной, так как не знаем точно, каким было бы значение зависимой переменной в отсутствие независимой переменной; мы можем лишь предполагать, что исходная тенденция сохранится. Однако по многим причинам это может оказаться ошибкой. Одна из наиболее важных причин (в терминологии Д.Кэмпбелла и Дж.Стэнли) – регрессия к среднему⁷. Это явление ставит под сомнение валидность выводов, сделанных на основании многих исследовательских программ. [c.144]

В самом общем виде регрессия к среднему – это процесс, в ходе которого объекты исследования, имеющие в определенный момент крайние значения по зависимой переменной, при последующих измерениях естественным образом стремятся вернуться к значению по этой переменной, более близкому к среднему, вне зависимости от того, подвергались ли они воздействию некоторой гипотетической независимой переменной. Если такая регрессия к среднему происходит в момент исследования, то исследователь может ошибочно принять естественную регрессию за результат воздействия независимой переменной. Это может представлять собой особую проблему в тех случаях, когда объекты исследования подвергаются воздействию независимой переменной именно потому, что у них появляются необычные значения зависимой переменной.

В нашем последнем примере полиция провела кампанию из-за исключительно большого числа арестов за проституцию. Такое положение было отклонением от нормы для данного города, и оно могло бы исправиться само по себе, даже если бы полиция ничего не предпринимала. Чтобы исключить регрессию в качестве альтернативного объяснения, можно применить программу контролируемых временных рядов.

В программе контролируемых временных рядов мы собираем данные об объекте или множестве объектов, которые во всех существенных отношениях сходны с исследуемым объектом или группой объектов, но не подвергались воздействию независимой переменной; и этот объект или группа объектов используется в качестве контрольных при оценке результатов воздействия независимой переменной. В нашем примере можно выбрать один или несколько городов, очень похожих на тот, в котором проводилась кампания по борьбе с проституцией (притом что в этих городах политика в отношении проституции не менялась), и посмотреть количество арестов за те же самые годы. Рис.4.5 демонстрирует некоторые возможные результаты. Сравнивая исследуемый город (в котором проводилась кампания) с группой похожих городов, мы можем заметить, что в отличие от изменившейся тенденции динамики арестов за проституцию в обследуемом городе в период до 1995 г. среднее количество арестов в контрольных [c.145] городах резко возрастает. Это наводит на мысль, что, хотя кампания по борьбе с проституцией не смогла изменить тенденцию, характерную для обследуемого города, она, возможно, предотвратила воздействие тех событий, которые вызвали рост числа арестов в других городах, похожих на данный. В этом случае мы используем различие между показателями для обследуемого города в период после кампании и показателями для контрольных городов в том же году в качестве меры воздействия независимой переменной, исходя из предположения, что, если бы не действия полиции, ситуация в обследуемом городе складывалась бы так же, как и в остальных, похожих на него городах. Например, в 2000 г. воздействие кампании расценивалось как два ареста на тысячу жителей.

В данном примере применение более строгой программы исследований уберегло бы нас от явно [c.146] неверного вывода, что программа, послужившая в качестве эффективного сдерживающего средства, не оказала никакого влияния. [c.147]

ВЫБОР ПРОГРАММЫ ИССЛЕДОВАНИЯ

Существует ряд как экспериментальных, так и квазиэкспериментальных программ, которые мы здесь не рассматривали⁸. Количество вариаций на базе этих основных программ ограничено лишь вашей собственной изобретательностью, и программа для любого исследования будет соответствовать его конкретной цели. Мы не столько выбираем, сколько создаем подходящую для конкретного случая программу, хотя обычно мы основываемся на одном из ключевых типов программ. При разработке программ исследователи руководствуются тремя основными факторами: требованием валидности, наличием средств и профессиональной этикой.

Цель программы в объяснительных исследованиях заключается в том, чтобы дать возможность делать валидные выводы о причинных отношениях между переменными, исходя из наблюдаемых изменений значений этих переменных. Следовательно, гарантия валидности результатов должна играть главную роль при разработке программы.

С эмпирическим исследованием связано два основных типа валидности: внутренняя валидность и внешняя валидность. Внутренняя валидность имеет отношение к надежности логического базиса, предоставляемого программой для осуществления вывода о том, вызывает ли независимая переменная изменение зависимой переменной. Вопрос о внутренней валидности – это вопрос типа:

“Имеется ли в программе исследования нечто такое, что позволит отнести причинное воздействие за счет независимой переменной (тогда как она такого воздействия не оказывает) либо не даст возможности установить наличие причинного воздействия, оказываемого независимой переменной?” Например, если имеется значительный тест-эффект, связанный с использованием некоторого определенного измерения, любая программа, не дающая возможности контролировать этот тест-эффект, не будет обладать внутренней валидностью, поскольку может вынудить нас ошибочно проинтерпретировать изменения, [c.147] вызванные тест-эффектом, как доказательства причинного воздействия независимой переменной. Внешняя валидность имеет отношение к возможности обобщения полученных результатов. Есть ли у нас основания надеяться на обнаружение тех же самых причинных воздействий в других условиях? Дает ли исследование возможность понять что-либо относительно той части действительности, которая в нем не представлена? Например, полевой эксперимент, в котором изучается воздействие на пользование автомобилем повышения цен на бензин (в размере доллара на галлон), не обладает внешней валидностью, если он приводится в группе, где среднегодовой доход семьи превышает 100 000 долларов, поскольку нельзя надеяться на то, что так же будут вести себя люди со средним и низким доходом. [c.148]

ФАКТОРЫ, УГРОЖАЮЩИЕ ВАЛИДНОСТИ

К числу основных факторов, представляющих собой угрозу как для внутренней, так и для внешней валидности, относятся следующие⁹.

Факторы, угрожающие внутренней валидности

1. История: события, отличные от проявлений независимой переменной, которые могут изменить оценки контрольного теста и происходят в промежутке между предварительным и контрольным тестами. Например, широковещательные заявления политического лидера могут изменить отношение испытуемых вне зависимости от некоторой долгосрочной обработки, которой они подвергаются в ходе эксперимента.

2. Развитие: естественные изменения, происходящие с испытуемыми, которые с течением времени оказывают влияние на оценки зависимой переменной вне всякой связи с независимой переменной (например, утомление, рост популяции в регионах, подвергающихся анализу, физическое старение).

3. Нестабильность: случайные изменения в зафиксированных значениях, возникающие вследствие ненадежных измерений, несоответствующего выбора испытуемых или по другим причинам. [c.148]

4. Тестирование: описанный в данной главе тест-эффект.

5. Инструментарий: различия в используемых средствах измерения, которые создают вариации в оценках, не связанные с воздействием независимой переменной (например, разные точки зрения у интервьюеров, плохо отрегулированный прибор, недостаточно точное кодирование).

6. Артефакты регрессии: изменения, происходящие в результате регрессии к среднему, обсуждавшемуся в данной главе.

7. Отбор: различия в оценках, возникающие в результате дифференцированного подхода к формированию экспериментальной и контрольной групп (например, в том случае, когда члены экспериментальной группы подвергаются воздействию независимой переменной в законном порядке, а члены одной из контрольных групп идут на это добровольно).

8. Смертность в эксперименте: разные уровни потерь испытуемых в экспериментальной и контрольной группе. (Например, те объекты, благодаря которым контрольная группа в целом реагирует на независимую переменную так же, как экспериментальная группа, могут выбыть из эксперимента до контрольного теста.)

9. Взаимодействие отбора и развития: непоследовательное проведение процессов отбора, которое ведет к разному уровню развития в экспериментальной и контрольной группах. (Например, в “операции по устрашению” испытуемые экспериментальной группы могут быть старше, так как они изъявили желание участвовать в программе лишь после ряда арестов в качестве малолетних правонарушителей, и они, таким образом, могут перерасти преступность несовершеннолетних скорее, чем более юная контрольная группа.)

Факторы, угрожающие внешней валидности

1. Взаимодействие результатов тестирования: оценки в контрольном тесте испытуемых, прошедших предварительное тестирование, могут быть сочтены непредставительными для совокупности, не прошедшей предварительный тест, в силу того, что предварительный тест [c.149] определенным образом повысил чувствительность испытуемых к независимой переменной.

2. Взаимодействие отбора и проведения эксперимента: в результате непоследовательно проведенного отбора может быть сформирована экспериментальная группа, реагирующая на независимую переменную иначе, чем генеральная совокупность.

3. Реактивное воздействие обстановки эксперимента: условия эксперимента могут быть нерепрезентативны с точки зрения условий окружающего мира.

4. Интерференция нескольких исследований: при одновременном осуществлении более чем одного исследования могут возникнуть изменения, отличные от тех, которые возникли бы, если бы каждое исследование проводилось отдельно.

5. Нерелевантные данные измерений: все измерения отражают многообразные аспекты окружающей действительности, в число которых могут входить нерелевантные компоненты, создающие видимость изменений при отсутствии таковых или маскирующие реальные изменения.

6. Нерелевантные повторения исследований: в том случае, когда независимые переменные являются сложными событиями (таковы, например, посещение тюрьмы в примере с “операцией по устрашению” или высшее образование), исследователи могут не знать, какой из аспектов события вызывает изменение в объектах исследования, и по ошибке не включить релевантный аспект независимой переменной во все экспериментальные предъявления.

В идеале в исследовании должна использоваться программа, позволяющая исключить как можно большее количество факторов, представляющих собой угрозу валидности. Однако и самая лучшая программа будет бесполезной, если у нас нет ресурсов для ее выполнения. Временной фактор, наличие денежных средств, обученных кадров, оборудования – все это накладывает ограничения при выборе программы исследования. Если исследователь не уверен, что основные факторы, способные представлять угрозу для валидности в данном исследовании, контролируются программой, удобной с точки зрения имеющихся ограничений на ресурсы, следует отложить реализацию проекта до того момента, пока нужные ресурсы окажутся в его распоряжении. Лучше отказаться от [c.150] исследования вообще, чем провести плохое исследование, в результате которого можно прийти к неверным выводам.

И последнее соображение относительно программы исследования. Оно касается возможного в ходе осуществления программы нарушения профессиональной этики. Не будет ли нанесен кому-либо какой-нибудь ущерб? Если да, то насколько серьезный? Не слишком ли это дорогая цена за ту пользу, которая может быть принесена обществу? Каждый ученый должен ответить на эти вопросы в соответствии со своими ценностными ориентациями и принятыми в его профессии нормами. В приложении Б перечисляются рекомендуемые этические нормы проведения исследований, одобренные в ведущих профессиональных ассоциациях политологов и социологов. Единственный руководящий принцип, который мы можем предложить для решения такого рода проблем, – это еще раз высказать наше убеждение, что наука существует не сама по себе, а является инструментом, служащим человечеству. [c.151]

5-лекция. КТО, ЧТО, ГДЕ, КОГДА: ПРОБЛЕМА ВЫБОРКИ

Раз в десять лет Бюро переписи, отдел министерства торговли США, проводит перепись, стремясь определить, подсчитать и измерить определенные характеристики образа жизни каждого человека в стране. Закон требует, чтобы все сотрудничали с лицами, проводящими перепись, и давали правдивые ответы на вопросы типа: “сколько у вас телевизоров?”, “есть ли в вашем доме водопровод?”. По имеющимся оценкам, перепись 1990 г. обошлась федеральному правительству в 2 600 000 000 долларов; для получения соответствующей информации было привлечено 480000 служащих, интервьюеров и других лиц, работавших в течение нескольких месяцев. Всего в США было идентифицировано и обследовано около 250 000 000 человек.

Надо ли говорить, что не многие политологи готовы к таким огромным затратам для удовлетворения своих личных исследовательских интересов. В то же время объекты их интересов (объекты исследования) для различных практических целей могут быть столь же многочисленны. Сто миллионов избирателей, четверть миллиарда жителей западных демократий, сто тысяч документов – все это может оказаться в центре внимания политологического исследования, хотя количество отдельных объектов в каждом из этих случаев слишком велико, чтобы их можно было всесторонне проанализировать. Даже Бюро переписи, со всеми его тысячами работников и миллионами долларов, оказалось не в состоянии задать каждому идентифицированному липу все свои вопросы. Вместо этого была разработана короткая анкета для большинства населения и более полная для отдельных респондентов. Так же как политологи и многие другие исследователи, Бюро переписи сочло необходимым использовать выборку.

В настоящей главе мы рассмотрим применение и механизм формирования выборки, отбора сравнительно небольшого числа объектов, изучение которых может дать [c.153] нам большой объем информации о генеральной совокупности, из которой они были выбраны. Поступая таким образом, мы будем иметь дело с тем, что мы назвали генерализацией, возможностью делать общие выводы, основанные на анализе небольшого числа объектов. С этой целью мы должны задать себе три вопроса. Во-первых, что же такое репрезентативная выборка? Во-вторых, какие существуют возможности для отбора конкретных объектов, которые образовали бы такую выборку? И в-третьих, сколько объектов необходимо отобрать, чтобы можно было назвать выборку репрезентативной? Рассмотрим поочередно все эти вопросы. [c.154]

РЕПРЕЗЕНТАТИВНАЯ ВЫБОРКА

Фактически мы начнем не с одного, а с трех вопросов: что такое выборка? когда она является репрезентативной? что она собой представляет?

Совокупность – это любая группа людей, организаций, интересующих нас событий, относительно которых мы хотим сделать выводы, а случай, или объект, – любой элемент такой совокупности¹. Выборка – любая подгруппа совокупности случаев (объектов), выделенная для анализа. Если мы захотим изучить деятельность законодателей штата по принятию решений, мы могли бы исследовать такую деятельность в законодательных органах штатов Виргиния, Северная Каролина и Южная Каролина, а не во всех пятидесяти штатах и, исходя из этого, распространить полученные данные на генеральную совокупность, из которой были выбраны эти три штата. Если мы хотим исследовать систему предпочтений избирателей Пенсильвании, мы могли бы сделать это, опросив 50 рабочих компании “Ю. С. Стил” в Питсбурге, и распространить результаты опроса на всех избирателей штата. Аналогично, если мы хотим измерить умственные способности студентов колледжей, мы могли бы протестировать всех игроков защиты, зарегистрированных в штате Огайо в данном футбольном сезоне, и затем распространить полученные результаты на генеральную совокупность, частью которой они являются. В каждом примере мы действуем следующим образом: устанавливаем подгруппу внутри генеральной совокупности, довольно [c.154] подробно изучаем эту подгруппу, или выборку, и распространяем наши результаты на всю совокупность. Это и есть основные этапы формирования выборки.

Однако представляется совершенно очевидным, что каждая из этих выборок имеет существенный недостаток. К примеру, хотя законодательные органы Виргинии, Северной Каролины и Южной Каролины и являются частью совокупности законодательных органов штатов, они в силу исторических, географических и политических причин, скорее всего, будут действовать очень схожим образом и совсем иначе, чем законодательные органы таких отличающихся от них штатов, как Нью-Йорк, Небраска и Аляска. Хотя пятьдесят рабочих-сталелитейщиков в Питсбурге действительно могут быть избирателями штата Пенсильвания, они в силу социально-экономического статуса, образования и жизненного опыта, вполне возможно, будут иметь взгляды, отличные от взглядов многих других людей, точно так же являющихся избирателями. И точно так же, хотя футболисты штата Огайо и являются студентами колледжей, они в силу самых разных причин вполне могут отличаться от других студентов. Иными словами, хотя каждая из этих подгрупп действительно является выборкой, члены каждой из них систематически отличаются от большинства остальных членов совокупности, из которой они выбраны. В качестве отдельной группы ни одна из них не является типичной с точки зрения распределения признаков мнений, мотивов поведения и характеристик в генеральной совокупности, с которой она ассоциируется. Соответственно, политологи сказали бы, что ни одна из этих выборок не является репрезентативной.

Репрезентативная выборка – это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности. Таким образом, если 50% всех законодательных органов штатов собираются лишь раз в два года, приблизительно половина состава репрезентативной выборки законодательных органов штатов должна быть такого типа. Если 30% избирателей Пенсильвании принадлежат к “синим воротничкам”, около 30% репрезентативной [c.155] выборки для этих избирателей (а не 100%, как в приведенном выше примере) должны быть из числа “синих воротничков”. И если 2% всех студентов колледжей являются спортсменами, приблизительно та же самая часть репрезентативной выборки студентов колледжей должна приходиться на спортсменов. Иными словами, репрезентативная выборка представляет собой микрокосм, меньшую по размеру, но точную модель генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Это распространение результатов и есть то, что мы называем генерализуемостью.

Возможно, пояснить это поможет графическая иллюстрация. Предположим, мы хотим изучать модели членства в политических группах среди взрослого населения США. На рис.5.1 изображено три круга, разделенных на шесть равных секторов. Рис.5.1а представляет всю рассматриваемую совокупность. Члены совокупности расклассифицированы в соответствии с политическими группами (такими, как партии и группы интересов), к которым они относятся. В этом примере каждый взрослый принадлежит по меньшей мере к одной и не более чем к шести политическим группам; и эти шесть уровней членства в одинаковой степени распространены в совокупности (отсюда равные сектора). Предположим, мы хотим исследовать мотивы вступления людей в группу, выбор группы и модели участия, однако из-за ограниченности ресурсов мы в состоянии обследовать только одного из каждых шести членов совокупности. Кого же отобрать для анализа?

Рис. 5.1. Формирование выборки из генеральной совокупности

Одну из возможных выборок заданного объема иллюстрирует заштрихованная область на рис.5.1б, однако она явно не отражает структуру совокупности. Если бы мы делали обобщения на основе этой выборки, мы пришли бы к выводу: (1) что все взрослые американцы принадлежат к пяти политическим группам и (2) что все групповое поведение американцев совпадает с поведением тех, кто принадлежит именно к пяти группам. Однако мы знаем, что первый вывод не верен, и это может зародить в нас сомнение относительно валидности второго. Таким образом, [c.156] выборка, изображенная на рис.5.1б, нерепрезентативна, поскольку она не отражает распределение данного свойства совокупности (часто называемого параметром) в соответствии с его реальным распространением. Про такую выборку говорят, что она смещена в направлении к членам пяти групп или смещена в направлении от всех остальных моделей членства в группах. Опираясь на такую смещенную выборку, мы обычно приходим к ошибочным выводам относительно генеральной совокупности.

Ярче всего это может быть продемонстрировано на примере катастрофы, постигшей в 30-е годы журнал “Литэрари дайджест”, который организовал опрос общественного мнения относительно результатов выборов. “Литэрари дайджест” представлял собой периодическое издание, в котором перепечатывались редакционные статьи из газет и другие материалы, отражавшие общественное мнение; этот журнал был очень популярен в начале века. Начиная с 1920 г. журнал проводил широкомасштабный общенациональный опрос, в ходе которого более чем миллиону человек по почте рассылались избирательные бюллетени с просьбой отметить, чья кандидатура на предстоящих президентских выборах для них предпочтительнее. В течение ряда лет результаты опроса, проводившиеся журналом, оказывались настолько точными, что опрос, проведенный в сентябре, казалось, делал ноябрьские выборы малосущественными. Да и как при такой большой выборке могла произойти ошибка? Однако в 1936 г. именно это и случилось: с большим перевесом голосов (60:40) победа была предсказана кандидату от республиканской партии Альфу Ландону. На выборах Ландон проиграл инвалиду – [c.157] Франклину Д. Рузвельту – практически с тем же результатом, с которым должен был победить. Доверие к “Литэрари дайджест” было столь сильно подорвано, что вскоре после этого журнал перестал выходить. Что же произошло? Все очень просто: в голосовании, проведенном “Дайджест”, использовалась смещенная выборка. Почтовые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регистрации автомобилей. И хотя прежде этот метод отбора не слишком отличался от других методов, совсем по-другому обстояло дело теперь, во время Великой депрессии 1936 г., когда менее состоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомобиле. Таким образом, фактически выборка, использовавшаяся в опросе, организованном “Дайджест”, была смещена в сторону тех, кто, скорее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта был такой хороший результат.

Как же решить эту проблему? Возвращаясь к нашему примеру, сравним выборку на рис.5.1б с выборкой на рис.5.1в. В последнем случае для анализа также отобрана шестая часть совокупности, однако каждый из основных типов совокупности представлен в выборке в той пропорции, в которой он представлен во всей совокупности. Такая выборка демонстрирует, что один из каждых шести взрослых американцев принадлежит к одной политической группе, один из шести – к двум и т.д. Такая выборка позволит также выявить другие различия между ее членами, которые могли бы соотноситься с участием в разном числе групп. Таким образом, выборка, представленная на рис.5.1в, является репрезентативной выборкой для рассматриваемой совокупности.

Конечно, данный пример является упрощенным по крайней мере с двух чрезвычайно важных точек зрения. Во-первых, большинство совокупностей, интересующих политологов, более разнообразно, чем та, что приведена в примере. Люди, документы, правительства, организации, решения и т.п. отличаются друг от друга не по одному, а по гораздо большему числу признаков. Таким образом, репрезентативная выборка должна быть такой, чтобы каждая из основных, отличная от других область была [c.158] представлена пропорционально ее доле в совокупности. Во-вторых, ситуация, когда реальное распределение переменных, или признаков, которые мы хотим измерить, заранее неизвестно, встречается гораздо чаще, чем противоположная, – возможно, оно не измерялось в предшествующей переписи населения. Таким образом, репрезентативная выборка должна быть построена так, чтобы она могла точно отражать существующее распределение даже тогда, когда мы не в состоянии прямо оценить ее валидность. Процедура формирования выборки должна иметь внутреннюю логику, способную убедить нас, что, будь мы в состоянии сравнить выборку с переписью, она действительно оказалась бы репрезентативной.

Чтобы обеспечить возможность точного отражения сложной организации данной совокупности и определенную степень уверенности в том, что предлагаемые процедуры способны сделать это, исследователи обращаются к методам статистики. При этом они действуют по двум направлениям. Во-первых, используя определенные правила (внутреннюю логику), исследователи решают вопрос о том, какие именно конкретные объекты им изучать, что именно включать в конкретную выборку. Во-вторых, используя совсем другие правила, они решают, сколько объектов выбрать. Мы не будем подробно изучать эти многочисленные правила, рассмотрим лишь их роль в политологическом исследовании. Начнем рассмотрение со стратегий выбора объектов, образующих репрезентативную выборку. [c.159]

ПРОЦЕДУРЫ ФОРМИРОВАНИЯ РЕПРЕЗЕНТАТИВНОЙ ВЫБОРКИ

Как видно из примеров предыдущего раздела, не все выборки в равной степени репрезентативны. Действительно, фиаско, постигшее “Литэрари дайджест”, хотя и один из самых известных, однако вряд ли единственный пример исследования, опиравшегося на плохо сформированную выборку. Предварительные выборы, в которых люди участвуют по собственной воле и могут голосовать за кандидата более одного раза; уличные интервью, в которых выбор места и невозможность контроля за прохожими могут оказать сильное воздействие на результаты; результаты проводимых законодателями опросов в большой [c.159] степени зависят от взглядов более красноречивого и интересующегося политикой меньшинства, представители которого, скорее всего, и будут отвечать на заданные вопросы; анализ иностранной прессы, пропагандистских материалов или материалов, опубликованных исключительно в англоязычных источниках, которые могут почему-либо отличаться от других источников того же самого типа, а также слепое формирование выборки, когда исследователь просто оставляет в определенном месте пачку анкет с инструкциями по их заполнению и отказывается от всякого контроля за отбором респондентов (подход, особенно характерный для студентов-дипломников), – все это типичные примеры смещения выборки. Частично эти трудности можно разрешить с помощью осторожного (и очень строго ограниченного) определения совокупности, на которую мы собираемся распространить наши выводы. В случае уличных интервью, например, мы могли бы пожелать распространить полученные результаты лишь на тех людей, которые проходят в данном месте между 10.00 и 11.15 утра 4 марта. Однако с гораздо большим успехом имеющиеся трудности можно разрешить, лишь разработав систематическую и гораздо более изощренную процедуру отбора объектов для анализа.

Ведущий принцип, лежащий в основе такой процедуры, – это принцип рандомизации, случайности. Выборка называется случайной (иногда мы будем говорить простая случайная или чистая случайная выборка), если выполняется два условия. Во-первых, выборка должна быть построена таким образом, чтобы любой человек или объект в пределах совокупности имел равные возможности быть отобранным для анализа. Во-вторых, выборка должна быть сформирована так, чтобы любое сочетание из п объектов (где п – просто количество объектов, или случаев, в выборке) имело равные возможности быть отобранным для анализа. Все это звучит довольно сложно. И действительно, это более строгое определение случайности, чем то, которым мы пользуемся в быту; однако в основе своей случайный выбор – довольно простое и незамысловатое понятие. Это почти то же самое, что выбор с помощью лотереи. Если у нас имеется совокупность, состоящая из 1000 человек, чье поведение мы хотим изучить, исследовав репрезентативную выборку, состоящую из [c.160] 100 человек, мы могли бы написать имена всех 1000 членов совокупности на листочках бумаги одинакового размера, сложить их в барабан, хорошо перемешать и отобрать имена 100 человек в нашу в выборку. При такой процедуре каждый человек имеет равную вероятность быть выбранным (100 шансов из 1 000, или, иными словами, 1 шанс из 10), любое возможное сочетание из 100 человек также имеет равную вероятность выбора. Наличие этих двух видов равновероятности и делает выборку случайной.

При исследовании совокупностей, которые слишком велики, для того чтобы можно было осуществить настоящую лотерею, часто используются простые случайные выборки. Выписать имена нескольких сотен тысяч объектов, сложить их в барабан и выбрать несколько тысяч – это все же нелегкая работа. В таких случаях используется другой, однако столь же надежный способ. Каждому объекту в совокупности присваивается номер. Номера объектов, которые будут включены в выборку, определяются с помощью таблицы случайных чисел типа табл. A.1 в приложении А, фрагмент которой воспроизведен на рис.5.2. Последовательность чисел в таких таблицах обычно задается компьютерной программой, называемой генераторам случайных чисел, который, в сущности, помещает в барабан большое количество чисел, случайным образом вытаскивает их и выпечатывает в порядке получения. Иными словами, имеет место все тот же процесс, характерный для лотереи, однако компьютер, используя не имена, а числа, осуществляет универсальный выбор. Этим выбором можно пользоваться, просто присвоив каждому из наших объектов номер.

Рис. 5.2. Фрагмент таблицы случайных чисел

Таблица случайных чисел типа той, что представлена на рис.5.2, может использоваться несколькими разными способами, и в каждом случае необходимо принять три решения. Во-первых, следует решить, сколько разрядов мы будем использовать, во-вторых, необходимо разработать [c.161] решающее правило для их использования; в-третьих, нужно выбрать исходную точку и способ прохождения по таблице.

Первое решение определяется просто количеством объектов в совокупности. Если совокупность состоит из менее чем 10 объектов, используются однозначные числа; при числе объектов от 10 до 99 – двузначные числа; от 100 до 999 – трехзначные и т.д. В каждом случае мы должны позаботиться о том, чтобы каждый перенумерованный объект имел возможность быть выбранным.

Как только это сделано, мы должны разработать правило, которое бы связывало числа в таблице с номерами наших объектов. Здесь существуют две возможности. Самый простой способ (хотя и не обязательно самый правильный) – использовать лишь те числа, которые попадают в число номеров, приписанных нашим объектам. Так, если мы имеем совокупность, состоящую из 250 объектов (и, таким образом, используем трехзначные числа), и решаем начать с левого верхнего угла таблицы и двигаться вниз по столбцам, мы включим в нашу выборку объекты с номерами 100, 084 и 128 и пропустим числа 375 и 990, не соответствующие нашим объектам. Этот процесс будет продолжаться до тех пор, пока не будет определено число объектов, нужных для нашей выборки.

Более трудоемкая, однако методически более правильная процедура основывается на положении, что для сохранения случайности, характерной для таблицы, должно быть использовано каждое число данной размерности (например, каждое трехзначное число). Следуя данной логике и вновь имея дело с совокупностью из 250 объектов, мы должны разбить область трехзначных чисел от 000 до 999 на 250 одинаковых промежутков. Поскольку таких чисел 1000, мы делим 1000 на 250 и находим, что каждая из частей содержит четыре числа. Таким образом, числа таблицы от 000 до 003 будут соответствовать объекту 1, от 004 до 007 – объекту 2 и т.д. Теперь, чтобы установить, какой номер объекта соответствует числу таблицы, следует разделить трехзначное число из таблицы и округлить до ближайшего целого числа. С помощью данного метода тот же фрагмент таблицы, которым мы пользовались раньше, позволит нам включить в выборку объекты 025 (100:4), 093 (375:4, округлено в меньшую сторону), [c.162] 021 (084:4), 247 (990:4, округлено в меньшую сторону) и 032 (128:4) и не пропустить ни одного числа из таблицы.

И наконец, мы должны выбрать в таблице исходную точку и способ прохождения. Исходной точкой может быть верхний левый угол (как в предыдущем примере), нижний правый угол, левый край второй строки или любое другое место. Этот выбор абсолютно произволен. Однако, работая с таблицей, мы должны действовать систематически. Мы могли бы взять три первых знака из каждой пятизначной последовательности, три средних знака, три последних знака или даже первый, второй и четвертый знаки. (Из первой пятизначной последовательности с помощью этих различных процедур получаются, соответственно, числа 100, 009, 097 и 109.) Мы могли бы применить эти процедуры в направлении справа налево, получив 790, 900, 001 и 791. Мы могли бы идти вдоль рядов, рассматривая поочередно каждую следующую цифру и игнорируя разбиение на пятерки (для первого ряда будут получены числа 100, 973, 253, 376 и 520). Мы могли бы иметь дело лишь с каждой третьей группой цифр (например, с 10097, 99019, 04805, 99970). Существует множество самых разнообразных возможностей, и каждая следующая ничуть не хуже предыдущей. Однако как только мы приняли решение о том или ином способе работы, мы должны систематически следовать ему, чтобы в максимальной степени соблюдать случайность элементов в таблице.

Таким образом, построение простой случайной выборки может оказаться совсем непростым делом. Кроме тех трудностей, которые мы еще будем обсуждать, данный метод требует большого объема технической работы, особенно когда речь идет о широкомасштабных исследованиях. По этой причине процедуры формирования случайной выборки часто видоизменяют, чтобы увеличить их возможности. Один из таких распространенных вариантов называется систематической случайной выборкой и используется тогда, когда мы хотим исследовать сравнительно большую совокупность, каждый член которой занесен в единый список, такой, как, например, телефонная книга, список студентов, список зарегистрированных избирателей, индекс или оглавление, повестка дня или [c.163] список членов какой-либо организации. Процедура выглядит следующим образом.

Подсчитайте (или оцените) количество объектов в совокупности и разделите его на желательное количество объектов в выборке (обсуждается ниже в данной главе). Если обозначить результат через k, то фактически можно сказать, что мы хотим выбрать один из каждых k объектов, или, говоря по-другому, каждый k-й объект. Это можно пояснить на конкретном примере.

Предположим, что из совокупности в 10 000 публичных заявлений, сделанных министерством обороны, мы хотим сформировать выборку размером в 500 документов; предположим также, что мы как свои пять пальцев знаем хронологический список, включающий все 10 000 документов. Чтобы отобрать систематическую случайную выборку:

1. Мы делим количество объектов в совокупности на желательный размер выборки, чтобы определить число k (в данном случае k= 10 000:500=20).

2. С помощью таблицы случайных чисел мы выбираем номер объекта между 1 и k (в нашем примере между 1 и 20) для включения в нашу выборку.

3. Мы движемся по списку документов, выбирая каждый k-й (двадцатый) объект.

Таким образом, если k равно 20 и мы пользуемся фрагментом таблицы случайных чисел, представленном на рис.5.2, начиная с верхнего левого угла таблицы, рассматривая двузначные числа (k в данном случае находится между 10 и 99) и используя только те элементы таблицы, которые соответствуют реальным номерам объектов (т.е. только те, которые находятся между 01 и 20), первым выбранным объектом будет 10. Мы, таким образом, включаем в нашу выборку объекты 10, 30 (10+k), 50 (10+2k), 70 (10+3k) и т.д., и так вплоть до объекта 9900 (10+499k). Эту верхнюю границу выборки можно задать в виде общей формулы j+(n–1)k, где j – первое случайное число, a n – желаемый объем выборки. Таким образом, можно воспользоваться таблицей случайных чисел в сочетании с единым списком для формирования в целях осуществления анализа выборки объемом в 500 документов.

Техника формирования систематической случайной выборки по сравнению с формированием простой случайной [c.164] выборки имеет два важных преимущества: ее удобно применять по отношению к большим совокупностям, отвечающим условию наличия единого списка, и у нее много потенциальных возможностей использования. Тем не менее, применяя эту процедуру, мы должны иметь в виду одну очень важную ее особенность. Поскольку систематическая случайная выборка менее случайна, чем прямой выбор типа лотереи, в результате может быть получена менее репрезентативная подгруппа. Это можно проследить и на уровне определения, и на операциональном уровне.

Прежде всего вспомним, что случайная выборка – это выборка, в которой каждый конкретный объект и каждое возможное сочетание из п объектов имеют равную вероятность быть выбранными. В систематической случайной выборке выполняется только одно из этих условий. Поскольку формирование такой выборки начинается с выбора по таблице случайных чисел первого объекта, любой объект из совокупности в конечном счете имеет равные возможности войти в выборку (хотя и не обязательно при первой попытке, так как она осуществляется в пределах от 1 до k). Однако поскольку далее мы выбираем лишь объекты, отстоящие на k номеров один от другого, не всякое возможное сочетание оказывается допустимым. Так, в примере при k=20 в качестве первого можно выбрать любой объект от 1 до 20, но, как только выбран объект с номером 10, мы уже не можем включить объекты с номерами 9,14, 237 и 5 724 просто потому, что номера этих объектов не отличаются от 10 на целое число k. Следовательно, систематическая случайная выборка – это в лучшем случае лишь приближение к истинной случайной выборке.

Данное наблюдение особенно важно, когда список, из которого производится выборка, характеризуется систематической направленностью. Для алфавитных и хронологических списков это обычно не существенно, однако для других типов списков может оказаться важным. Например, мы хотим измерить уровень умственных способностей в выборке, состоящей из учеников школы, в каждом классе которой 20 детей. В школе 100 классов, т.е. всего 2000 учеников. В ответ на нашу просьбу директор предоставляет список всех учеников школы, из которого мы собираемся извлечь выборку объемом в 100 человек. Однако перед нами не алфавитный [c.165] список, а последовательность списков отдельных классов. Более того, список каждого класса дан не в алфавитном порядке, а соответствует положению, занимаемому учеником в классе: лучшие ученики идут вначале, и списки продолжаются в порядке убывания успехов. При таком положении дел, если выбирать каждого двадцатого (2000:100), начиная со случайным образом выбранного объекта под номером 1, мы получим выборку, состоящую из 100 лучших (и, возможно, самых умных) учеников школы. Если случайным образом будет выбран объект 10, в выборку попадут одни середняки. А если начать с объекта 20, то мы выберем лишь самых плохих учеников школы. Иными словами, внутренняя направленность, характеризующая список, на котором основана наша выборка, окажется причиной получения нерепрезентативной выборки. В конце концов все это приведет к тому, что мы либо не сможем обобщить наши результаты на генеральную совокупность, либо (если возникшая ситуация останется незамеченной) придем к потенциально неверным выводам. Хотя данный пример достаточно примитивен и приведен специально в целях иллюстрации, подобного рода списки, характеризующиеся определенной направленностью, действительно существуют, и исследователь, использующий процедуры, формирующие систематическую случайную выборку, должен быть подготовлен к таящейся здесь опасности.

Таким образом, простая случайная выборка – это идеал, к которому мы стремимся, а систематическая случайная выборка – приближение к этому идеалу. Однако очень часто исследуемая ситуация такова, что не позволяет применить ни тот, ни другой метод. В особенности это касается случаев выборочного исследования. Ведь зачастую не бывает сведенных воедино списков совокупности, подлежащей изучению (так, например, не существует списка всех американских избирателей или всех жителей данного города), и даже количество (не говоря уже о конкретном составе) имеющихся объектов может быть заранее неизвестно. Таким образом, может оказаться невыполненным основное условие, необходимое для формирования простой или систематической случайной выборки, – наличие отдельных заранее идентифицируемых объектов. Более [c.166] того, даже тогда, когда эта проблема может быть решена, технические трудности и ограниченные ресурсы могут привести к тому, что оба метода формирования выборки окажутся нереализуемыми. Это происходит потому, что случайный выбор конкретных объектов предполагает условие: в выборку должны быть включены определенные лица, – причем может оказаться, что они либо живут далеко друг от друга, либо с ними трудно поддерживать связь. Случайный в строгом смысле слова процесс не допускает никаких замен. Все эти факторы могут привести к таким огромным затратам времени и средств, при которых исследование вообще окажется невозможным.

К счастью, существует другой метод, сохраняющий ценные для нас достоинства случайного выбора и лишенный большинства отмеченных недостатков. Этот метод (его называют либо методом кластерной выборки, либо методом многоступенчатого случайного районирования) нашел широкое применение в выборочном исследовании. В основе многоступенчатой случайной районированной выборки лежит следующее соображение: вместо того чтобы считать в качестве членов выборки конкретных людей, будем рассматривать их как жителей того или иного пункта. Эта замена объясняется тем, что в отличие от людей, переезжающих с места на место, само по себе место жительства остается неизменным. Кроме того, расположение фактически любого места жительства в стране известно и нанесено на карту, каждое является частью различных географически определенных зон, таких, как кварталы, переписные участки, избирательные участки, законодательные округа, города, районы, округа, избирательные округа по выборам в конгресс и, наконец, штаты.

Мы увидим, что некоторые из этих районов обладают свойствами, благоприятными для получения репрезентативной выборки. Пока же отметим, что, принимая во внимание жителя места, которое всегда остается постоянным, а не конкретного человека, который может быть более подвижным, мы оказываемся в состоянии стабилизировать и локализовать процедуру формирования выборки. Фактически мы просто даем другое определение нашему понятию совокупности. Вместо того чтобы говорить (если бы речь шла об исследовании [c.167] в масштабах страны) обо всем населении, живущем в Соединенных Штатах, мы говорим об отдельных людях в местах их проживания. Поскольку с точки зрения любой практической цели между этими группами нет различий, мы можем сформировать выборку на основе второй группы и распространить полученные выводы на первую. Мы пользуемся гораздо более простыми и (по ряду причин, которые будут рассмотрены ниже) гораздо менее дорогостоящими методами выбора мест жительства, и тем не менее мы можем распространять наши выводы не на места жительства, а на населяющих их людей. В этом и состоит основная ценность многоступенчатой случайной районированной выборки.

Сама эта процедура иллюстрируется на рис.5.3, где суммируется практика Центра выборочных исследований (ЦВИ) Мичиганского университета – основного национального центра по проведению выборочных исследований в политологии. Хотя в своих частностях процедура, используемая в ЦВИ, слегка отличается от той, которую будем описывать мы, обе они складываются из одних и тех же основных этапов. Итак, предположим, что мы собираемся проводить общенациональное выборочное исследование. Те процедуры, которые мы здесь рассматриваем, безусловно, могут быть применены в менее масштабных проектах.

Рис. 5.3. Последовательность шагов в процессе многоступенчатой случайной районированной выборки (см.: Interviewer's Manual: Survey Research Center. –Ann Arbor: Institute for Social Research, University of Michigan, 1969. Р.8)

Начнем с того, что возьмем карту Соединенных Штатов и поделим ее на большое число районов с одинаковой численностью населения². Это не так трудно, как кажется на первый взгляд, так как правительство уже осуществило такую (или по крайней мере близкую к нему) разбивку, образовав 435 избирательных округов по выборам в конгресс, население каждого из которых составляет немногим более полумиллиона человек. Мы приписываем каждому такому округу одно из чисел между 1 и 435 и, пользуясь таблицей случайных чисел, отбираем для анализа несколько округов. Сколько именно округов будет выбрано, зависит как от предельного размера формируемой выборки, так и от имеющихся в нашем распоряжении ресурсов, но в целом, чем больше будет выбрано округов, тем лучше будет выборка. На этом этапе становится очевидной экономичность метода многоступенчатой случайной районированной выборки, поскольку, вместо того чтобы отыскивать [c.169] респондентов по всей стране, мы можем сконцентрировать наше внимание (и денежные средства) на сравнительно небольшом числе территорий, размеры которых в основном поддаются контролю. Таким образом, операции могут быть сосредоточены в нескольких местных отделах.

Как только определены соответствующие округа, каждый из них далее подразделяется на еще меньшие по размеру, однако имеющие одинаковую численность населения территории. Зачастую они могут совпадать с существующими политическими образованиями, такими, как избирательные участки или избирательные округа. Затем эти избирательные участки подразделяются дальше – вначале на переписные участки, потом на кварталы и, наконец, на отдельные жилые единицы (дома и квартиры), – при этом на каждом этапе отбора используется процесс случайного выбора. В конце концов мы установим множество отдельных жилых единиц, количество которых приблизительно соответствует желательному объему нашей выборки. Их жители и будут объектами нашего исследования.

Существует тем не менее еще одна трудность: хотя обычно мы по ряду причин предпочитаем брать интервью лишь у одного лица по данному адресу, в каждом конкретном доме или квартире вполне может проживать несколько человек. У кого же брать интервью? Большинство исследователей, использующих такие процедуры формирования выборки, снабжают интервьюируемых рядом правил, регулирующих принятие решений на данном этапе, так чтобы в результате было получено множество квот на основе возраста, пола, и/или семейного положения респондента. В одном месте интервьюируемый может получить инструкцию выбрать самого младшего члена семьи мужского пола, в другом – самого старшего члена семьи женского пола и т.д. Во многих случаях искомый респондент определяется с помощью карт, подобных тем, что изображены на рис.5.4. Интервьюируемый получает несколько таких карт, в которых объект исследования устанавливается по-разному в зависимости от конкретного состава семьи; кроме того, он снабжается инструкцией последовательно использовать эти карты при переходе от одного интервью к другому. [c.170]

Рис. 5.4. Карты выбора респондентов

Таким образом, многоступенчатая случайная районированная выборка действительно наглядна. На каждом из этапов среди районов с одинаковым населением (либо среди районов, для которых вероятность быть выбранными устанавливается пропорционально их населению) осуществляется случайный выбор, пока наконец не устанавливаются отдельные жилые единицы. В каждом случае объектом процедуры выбора является географическая местность, и на каждом этапе определяется несколько групп местностей (отсюда и другой термин – кластерная выборка). Лишь на последнем этапе – этапе установления конкретных респондентов – процедура осуществляется с нарушением принципа случайности, однако на столь локальном уровне и с использованием столь аккуратно составленных квот, что воздействие на репрезентативность выборки, по всей вероятности, является при этом минимальным. Во многих случаях многоступенчатая случайная районированная выборка (так же как аналогичные [c.171] процедуры выбора, используемые при выборочном обследовании) дает приемлемое приближение к действительно случайной выборке при небольших затратах времени и средств.

Необходимо упомянуть еще один метод, хотя это скорее не процедура выбора, а всего лишь стратегия. Этот метод известен под названием стратифицированного формирования выборки и используется в первую очередь тогда, когда мы хотим детально исследовать некоторую подгруппу совокупности, которая так мала, что случайная выборка будет содержать слишком небольшое для такого анализа количество членов этой подгруппы.

Предположим, к примеру, что мы хотим проверить гипотезу, согласно которой, в течение первых двух месяцев своего правления (периода, часто называемого “медовым месяцем”) президенты более откровенны со средствами массовой информации, чем когда бы то ни было в дальнейшем, и что для проверки этой гипотезы мы собираемся анализировать содержание стенограмм пресс-конференций президентов. Предположим далее, что за некоторый период времени в нашем распоряжении имеется 500 таких стенограмм и лишь 25 из них представляют пресс-конференции периода “медового месяца” и что мы хотим включить в выборку всего 100 пресс-конференций. Если использовать в этом случае простой или систематический случайный выбор, можно ожидать, что в выборку будет входить приблизительно 5 стенограмм периода “медового месяца” и приблизительно 95 стенограмм последующего периода. Столь небольшое число стенограмм первого типа очень затрудняет осмысленное сравнение, поскольку при этом может оказаться слишком мало примеров, которые бы давали точную картину ответов президента на вопросы журналистов.

В таких условиях, когда мы хотим повысить значимость (придать больший вес) определенной подгруппы, мы применяем метод стратификации. Поступая таким образом, мыв действительности формируем не одну, а две отдельные выборки. Первая – это простая или систематическая случайная выборка для меньшей подгруппы (стенограммы периода “медового месяца”), и по объему она будет больше, чем ожидалось, в соответствии с частотой появления этой подгруппы в исходной выборке (в нашем [c.172] примере это будет не 5, а, скажем, 15 объектов). Вторая – это простая или систематическая случайная выборка для большей подгруппы (стенограммы всех периодов, следующих после “медового месяца”), и по объему она будет меньше, чем ожидалось, в соответствии с частотой появления в исходной выборке (в нашем примере – 85, а не 95 объектов). В данном случае выборку можно назвать стратифицированной относительно времени проведения пресс-конференции. В результате мы получим относительно больше объектов из числа стенограмм периода “медового месяца” для анализа и сопоставления со стенограммами более поздних периодов, чем могли бы отобрать, используя другие методы.

Здесь следует сделать три замечания. Во-первых, стратификация не заменяет простой случайный выбор или какой-либо иной вид выбора, а представляет собой дополнительную возможность, используемую в определенных обстоятельствах. Фактически это процедура формирования выборки второго порядка. При этих условиях стратификация используется достаточно часто, в особенности при опросе общественного мнения, на последних этапах формирования выборки, чтобы обеспечить, к примеру, необходимое равновесие между количеством мужчин и количеством женщин. Таким образом, по своему назначению стратификация очень напоминает квоты, которые используются на последнем этапе многоступенчатой районированной выборки.

Во-вторых, поскольку стратификация требует формирования отдельных выборок, она может использоваться лишь там, где мы в состоянии заранее установить релевантные субсовокупности. В нашем примере это не составляет труда, поскольку до начала формирования выборки мы легко можем отличить стенограммы периода “медового месяца” от стенограмм более поздних периодов. Однако во многих выборочных обследованиях, там, где мы, быть может, захотели бы провести стратификацию, опираясь на менее очевидные переменные, нас могут ожидать большие трудности.

В-третьих, поскольку при стратифицированном формировании выборки используются отдельные выборки и поскольку единственное, что мы в состоянии сделать, – это распространить результаты, полученные на данной [c.173] выборке, на ту самую совокупность (или субсовокупность), из которой она извлечена, мы должны с очень большой осторожностью делать выводы на основании исследования, базирующегося на такой выборке. Причина этого вполне ясна: проводя стратификацию с целью повышения в нашем исследовании количества объектов определенного типа, мы фактически смещаем всю выборку в сторону этих объектов.

Чтобы преодолеть это смещение, следует формулировать наши выводы одним из двух единственно возможных способов. Во-первых, мы можем сопоставить друг с другом результаты, полученные для групп, по которым проведена стратификация (например, можем сопоставить результаты для пресс-конференций периода “медового месяца” с результатами для пресс-конференций более поздних периодов). В этом случае мы просто сравниваем результаты для отдельных выборок, не делая никаких выводов о пресс-конференциях в целом. Во-вторых, мы можем приписать разный вес группам, по которым проведена стратификация, пропорционально их доле в совокупности и затем сделать выводы относительно всей совокупности. В этом случае мы в полной мере используем имеющиеся в нашем распоряжении подробные сведения о меньшей подгруппе (пресс-конференциях периода “медового месяца”), но уменьшаем их роль в совокупности всех пресс-конференций (точнее, восстанавливаем правильное соотношение). При использовании данной процедуры стратифицированная выборка может служить в качестве приближения к простой случайной выборке, давая при этом более полную информацию.

Иногда более полезными могут оказаться другие виды выборок. Одна из них – это квотная выборка, когда члены совокупности классифицируются в соответствии с несколькими релевантными характеристиками (такими, как пол, возраст или идентификация партийной принадлежности) и лица, обладающие такими свойствами, отбираются в количестве, пропорциональном их доле в совокупности. Еще один тип – это экспертная выборка, когда наблюдатель просто выбирает те объекты, которые он по какой-то причине считает типичными или репрезентативными для той совокупности, из которой они извлечены. Такая выборка чаще всего используется при исследовании [c.174] небольших совокупностей и элитарных или специализированных групп. Необходимо, однако, помнить, что такого рода выборки не являются действительно репрезентативными для соответствующих совокупностей (в самом деле, в противоположность случайным выборкам вероятность и степень репрезентативности этих выборок неопределенны) и поэтому они менее предпочтительны. [c.175]

УСТАНОВЛЕНИЕ НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ

После того как определены термины и рассмотрены процедуры выбора, остается обсудить последний вопрос: каким образом следует решать, сколько выбрать объектов. Ответ на этот вопрос в значительной степени требует привлечения сложных статистических понятий, которые мы не в состоянии обсуждать в рамках настоящей книги. По этой причине часть из того, о чем говорится в данном разделе, должна быть принята на веру, хотя в конце главы мы все-таки указываем некоторые книги, в которых эти проблемы обсуждаются. Спешим, однако, подчеркнуть, что большинство соображений, лежащих в основе определения необходимого объема выборки, понять достаточно просто и, прежде чем двигаться дальше, стоит уделить им немного внимания.

Чтобы установить необходимый объем выборки следует учесть несколько факторов. Один из наиболее важных – гомогенность – степень близости друг к другу членов данной совокупности с точки зрения изучаемых нами характеристик. Если каждый индивидуум в совокупности в точности такой же, как все остальные, то, выбрав всего лишь одного из них, мы получим действительно репрезентативную выборку. Напротив, если каждый индивидуум в совокупности абсолютно не похож ни на какой другой, то, прежде чем мы сможем утверждать, что у нас имеется репрезентативная выборка, нам потребуется провести перепись всей совокупности. В первом случае совокупность называют полностью гомогенной, во втором–полностью гетерогенной. Разумеется, в действительности большинство совокупностей располагается между этими двумя полюсами.

Чем гомогенное данная совокупность, т.е. чем меньше различий между ее членами, тем меньшая по объему выборка необходима для ее представления. Напротив, чем гетерогеннее совокупность, т.е. чем больше различий [c.175] между ее членами, тем большая выборка необходима для ее представления. Это особенно важно учитывать при стратифицированном формировании выборки, поскольку самим актом стратификации мы создаем подгруппы, более гомогенные, чем совокупность в целом. Таким образом, внутри уровней можно использовать, не теряя при этом репрезентативности, выборки меньшего объема, чем следовало бы для всей совокупности.

Сходным образом, чем больше категорий мы хотим исследовать, тем больше должна быть выборка. Это вполне естественно, поскольку, увеличивая разнообразие и тонкость наших измерений, мы подчеркиваем гетерогенность исследуемой совокупности. Иными словами, чем больше вопросов мы задаем и чем больше типов ответов допускаем, тем больше вероятность того, что мы обнаружим различия между исследуемыми объектами. Чем больше различий между объектами мы принимаем во внимание, тем больше объектов мы должны изучить, чтобы выборка получилась репрезентативной.

Еще одно важное соображение касается степени точности, которая нам требуется. Мы используем выборку для оценки характеристик больших совокупностей, однако любая оценка может содержать ошибку. Какую ошибку выборки мы готовы допустить? Ответ часто зависит от предполагаемого использования результатов. Если мы получаем деньги за то, что проводим опрос общественного мнения для предсказания результатов выборов, в которых участвуют кандидаты с близкими шансами, мы, скорее всего, захотим иметь минимальную величину ошибки. Если же мы политологи и пытаемся раскрыть основные тенденции в области отношений и поступков людей, мы, видимо, согласимся допустить существенно большую величину ошибки. Вообще, чем большая точность нам требуется, тем больше должна быть наша выборка.

С этой же проблемой связан и второй вопрос: насколько мы можем быть уверены в правильности нашей оценки величины ошибки выборки? Читателю, недостаточно искушенному в статистике, возможно, непросто понять приводимые в этом случае доводы, однако предлагаемый ниже пример может кое-что прояснить. Здесь существенны следующие моменты. Каждая выборка дает нам некоторую оценку характеристик совокупности, однако вследствие [c.176] того, что никакие две выборки не будут в точности одинаковы, эти оценки будут несколько отличаться одна от другой и от оценки совокупности в целом. Это последнее отличие и есть ошибка выборки. Большинство выборок данного объема, взятых из одних и тех же совокупностей, будут очень похожи друг на друга и на саму совокупность, однако может случиться и так, что сформированная выборка будет отличаться от прочих. Может оказаться, что входящие в ее состав женщины, пожилые люди, республиканцы, выпускники колледжей и т.п. включены в таком количестве, которое не отражает реальной доли этих групп в соответствующих совокупностях. Такая выборка, естественно, не будет репрезентативной: она выйдет за рамки допустимой величины ошибки.

Проблема заключается в том, что в реальной действительности мы не всегда знаем внутренние параметры совокупности, для оценки которых предназначена наша выборка (зачастую установление таких параметров и является целью исследования); кроме того, мы формируем не множество выборок, а всего лишь одну. И хотя мы сумеем проконтролировать очевидную валидность нашей выборки, проведя сравнение с другими исследованиями той же самой совокупности или совокупности, похожей на данную, мы не можем быть уверены, что наша выборка не случайное исключение, что она нерепрезентативна (это мало вероятно, но возможно). Однако из занятий статистикой нам известно, что вероятность вытащить из горы яблок гнилое, можно снизить, если увеличить объем выборки. Чем больше объектов мы включим, тем выше вероятность того, что будет получена истинно репрезентативная выборка, которая действительно не выйдет за рамки заданной нами величины ошибки.

Наши рассуждения можно сделать менее абстрактными, если рассмотреть краткие характеристики выборок разного объема, представленные в табл.5.1. Эти характеристики получены на основе более обширных сведений, содержащихся в табл. А.2 и А.3 приложения А. В табл.5.1 перечислены минимальные объемы выборок, соответствующие нескольким уровням ошибки выборки, и степени уверенности для случая простой случайной выборки при относительно гетерогенной совокупности объемом более 100 000 объектов. (Изучение таблиц приложения А, [c.177] послуживших источником для данной таблицы, показывает, что при формировании выборок для меньших совокупностей приводимые цифры могут быть несколько уменьшены, однако при возрастании объема совокупности приводимые значения задают предельный объем выборки.)

Таблица 5.1

Краткие характеристики выборок разного объема

Допустимый процент ошибки выборки	Степень уверенности	+
Допустимый процент ошибки выборки	0,95	0,99*
± 1	10 000	22 500
± 2	2 500	5 625
± 3	1 111	2 500
± 4	625	1 406
± 5	400	900
± 10	100	–

^*Для большей наглядности имеющееся в исходной таблице значение 0,997 округлено до 0,99.

Возможно использовать эти три таблицы каждым из двух методов.

Мы, возможно, захотим задать определенный уровень ошибки выборки, который мы согласны допустить, и степень уверенности, с которой будем действовать. Предположим, что взяты, соответственно, числа ±4% и 0,99. Первое число означает, что любое измерение, которое мы могли бы произвести в нашей выборке, отклоняется не более чем на четыре процента вверх или вниз от истинного значения того же признака в более обширной совокупности. Если, например, мы устанавливаем, что в проводимом исследовании 43% респондентов сообщают о своей солидарности с демократической партией, мы будем считать, что в случае полной переписи населения реальное количество приверженцев демократической партии будет составлять 43% ± 4% или находиться в пределах приблизительно от 39 до 47%. В соответствии с таблицей (если посмотреть на пересечение строки ± 4% и столбца 0,99) для достижения данной степени точности с уверенностью 99% мы должны иметь выборку, состоящую по крайней мере из 1406 объектов. Если мы хотим уменьшить величину ошибки (повысить точность) до, скажем, ± 2% [c.178] (т.е. оценить количество демократов более точно, в пределах от 41 до 45%), мы должны увеличить объем выборки по крайней мере до 5625 объектов. Из таблицы отчетливо видно, что при любой степени уверенности повышение точности требует увеличения выборки.

Второе число, о котом мы говорили, обозначает вероятность того, что наша выборка действительно репрезентативна для более обширной совокупности в рамках заданной степени точности. В данном контексте 0,95 (95% уверенности) означает, что из 100 выборок данного объема, полученных из одной и той же совокупности, 95 выдержат тест на точность, а 0,99 (99% уверенности) означает, что 99 из 100 выборок данного объема, полученных из одной и той же совокупности, будут точны настолько, насколько это было предсказано. Таким образом, вероятность того, что любая конкретная выборка будет давать желаемую точность, равна, соответственно, 95:5 (т.е. 19:1) и 99:1.

Как и следовало ожидать, для каждого уровня ошибки выборки необходимый объем выборки значительно больше в том случае, когда мы хотим достичь 99, а не 95% уверенности. Так, в нашем примере с демократами видно, что при величине ошибки 4% выборка объемом 625 объектов позволяет с 95%-ной уверенностью утверждать, что доля демократов среди населения находится где-то между 39 и 47%, тогда как то же самое утверждение с 99%-ной уверенностью требует выборки объемом по меньшей мере 1406 объектов. Вообще говоря, чем ниже ошибка выборки и чем выше степень уверенности, тем лучше будет то исследование, которое мы проводим. Для политологического исследования степень уверенности 0,95 или 0,99 принято считать вполне приемлемой.

Таблицу такого вида можно использовать иначе. Если, к примеру, мы анализируем исследование, в котором используется выборка, состоящая из 2500 объектов, то тогда можно обратиться к таблице и установить ошибку выборки и степень уверенности. Посмотрев в табл.5.1, видим, что интерпретация может быть неоднозначной. Мы можем считать, что 2500 объектов дают ошибку выборки ± 3% с уверенностью 0,99 или ошибка выборки ±2% с уверенностью 0,95. Каждая из этих интерпретаций в равной степени приемлема, а вместе они помогают прояснить взаимоотношения между точностью и [c.179] уверенностью. При одном и том же количестве объектов мы будем в состоянии располагать высокой степенью уверенности относительно менее точного результата или несколько меньшей степенью уверенности относительно более высокой точности. Однако нельзя одновременно и вкушать от пирога исследования, и оставлять его нетронутым.

Конечно, в идеале мы всегда предпочитаем действовать с минимальными ошибками и с максимальной уверенностью. К сожалению, в дело часто вмешиваются практические соображения. Например, стоимость одного личного интервью в исследовательском проекте может равняться 50 долларам, включая собственно расходы на интервью, расходы на транспорт и пр. Это означает, что при 99%-ной уверенности стоимость снижения величины ошибки с ±3 до ±2% может составлять 130 000 долларов. Во многих случаях различие в качестве результатов не стоит производимых дополнительных затрат, а в гораздо большем числе случаев средств просто нет. Таким образом, важную роль в ограничении объема выборки играют ограничения на ресурсы. В большинстве наиболее значительных опросов общественного мнения, а также в большинстве наиболее значительных исследовательских проектов в области политологам используются выборки объемом приблизительно 1400–1600 респондентов. Такие исследования дают результаты с точностью 3–4% и со степенью уверенности 0,99 и считаются одновременно и возможными, и достаточно точными. Проекты, использующие контент-анализ или другие относительно менее дорогостоящие методы сбора данных, часто тяготеют к верхнему правому углу таблицы.

Прежде чем мы завершим обсуждение проблемы объема выборки, следует затронуть еще один вопрос, хотя он, несомненно, менее очевиден и интуитивно менее привлекателен, чем все то, о чем мы говорили ранее. Внимательное изучение табл. А.2 и A.3 приложения А показывает, что, достигнув определенного предела, размер совокупности не влияет на объем выборки, которая должна ее представлять. В то время как доказательство этого утверждения выходит за рамки настоящей книги, вытекающие из него следствия касаются нас вплотную. Ведь, в сущности, наличие такого верхнего предела означает, что практически одна и та же выборка, если она должным образом [c.180] сформирована, может быть в равной степени репрезентативна для населения г.Роанока (штат Виргиния), г. Нью-Йорка, Соединенных Штатов и всего Западного полушария. Размер совокупности является важным фактором при определении объема выборки лишь в случае относительно небольших совокупностей.

Итак, подводя итоги, следует подчеркнуть, что, формируя выборку, необходимо очень внимательно следить за тем, чтобы не только отобрать из данной совокупности достаточное количество объектов, но и взять такую группу, которая, как представляется, будет действительно репрезентативной с точки зрения распределения характеристик внутри данной совокупности. Должное внимание на этом этапе процесса исследования в дальнейшем окупится сторицей. Наоборот, небрежность при формировании выборки может нанести непоправимый вред любому исследованию. [c.181]

ВЫВОДЫ

Начинающий политолог часто упускает из виду один важный момент: каждый раз, когда осуществляется сбор данных любым методом и из любого источника, у исследователя появляется соблазн распространить свои выводы на все остальные объекты. Именно для того, чтобы подчеркнуть этот факт, мы предпочли обсудить проблему формирования выборки здесь, а не в разделе, посвященном выборочному обследованию. Что бы ни было объектом исследования: события, политические заявления, подборки новостей, политические юрисдикции, организации, общественное мнение или любые другие интересующие вас вопросы, – важно понимать определяющую роль процесса отбора и его влияние на значимость и полезность исследования. [c.181]

6-лекция.МЕТОДЫ СБОРА ДАННЫХ

6. ОПРОС

Зачастую лучший (а подчас и единственный) способ узнать, о чем люди думают и как они поступают, состоит в том, чтобы просто спросить их об этом. Признание этого факта привело к тому, что одним из наиболее распространенных методов в социальных науках стал опрос¹. Овладение опросной методикой необходимо для понимания того, как развивалась политология в 30–80-х годах. В данной главе мы вкратце рассмотрим, в чем заключается этот метод, в каких случаях его уместно применять и каковы его сильные и слабые стороны. В следующих двух главах будут рассмотрены процедуры интервьюирования и шкалирования, усвоение которых небесполезно, если вы хотите успешно осуществить опрос.

Опрос – это метод сбора данных, при котором исследователь получает информацию непосредственно от представителей населения, отобранных таким образом, чтобы на основании их ответов можно было с достаточной надежностью делать выводы обо всем населении или о какой-то его части². Такая информация может быть получена либо с помощью очного или телефонного интервью, либо с помощью заполнения опрашиваемыми анкет-вопросников, доставленных им по почте или кем-то из проводящих опрос. Эти способы являются составной частью опроса как более общего метода. Лица, которые отвечают на вопросы, называются респондентами.

Опрос предоставляет исследователю информацию пяти типов: факты, знания (perceptions), мнения (opinions), отношения (attitudes) и поведенческие отчеты (behavioral reports) респондентов. В разряд фактов входят те биографические сведения о респонденте (возраст, род занятий, место рождения, первое политическое увлечение), которые могут оказаться существенными при интерпретации других данных. К разряду знаний относятся суждения респондента об окружающем мире, т.е. то, что он [c.183] знает или ему кажется, что он знает (например, фамилии должностных лиц или же сведения о политике федерального правительства в отношении торговли с Кубой). В разряд мнений входят суждения респондента о его предпочтениях или взглядах на определенные предметы и события. На выявление мнений нацелены, например, такие вопросы, как:“Вы за или против легализации торговли наркотиками?”, “Кого бы Вы хотели видеть победившим на предстоящих местных выборах?”. К отношениям можно причислить сравнительно устойчивые настроения респондентов и их оценки определенных событий, явлений и идей. Когда мы пытаемся выяснить, в какой мере население одобряет экономическую политику правительства, то при этом имеем дело с отношениями, на которых зачастую основываются определенные мнения. Поведенческие отчеты – это утверждения респондентов о том, как они поступают в том или ином случае (как голосуют, читают газетные передовицы, участвуют в деятельности какой-либо политической организации и т. п.)³.

При опросе средством операционализации понятий служат вопросы, а наблюдение состоит в фиксировании ответов респондентов на эти вопросы. Поэтому этот метод особенно подходит для тех исследований, в которых единицами анализа являются индивиды и основные используемые понятия также связаны с индивидами. В исследовании, имеющем дело с такими, допустим, понятиями, как среднегодовой импорт нефти Соединенными Штатами или число преступлений, совершаемых за год с использованием личного огнестрельного оружия, применение опроса неправомерно, потому что рядовые граждане, скорее всего, не располагают интересующей исследователя информацией об этих явлениях (хотя, наверно, интервью с кем-нибудь из представителей министерства энергетики или ФБР и дало бы требуемые сведения). Если же внимание исследователя сфокусировано на мнениях, отношениях или знаниях индивидов, то в этом случае выборочный опрос может оказаться самым оптимальным способом сбора данных. Однако это очень долгий и дорогостоящий метод. Исследователю следует учитывать, что обеспечить адекватное финансирование крупного проекта может быть очень трудно, поэтому, прежде чем [c.184] приступать к выборочному опросу, надо проверить, нет ли другого, более дешевого способа получения необходимой для целей данного исследования информации⁴. [c.185]

ЭТАПЫ ПРОВЕДЕНИЯ ОПРОСА

Придя к решению использовать опрос в качестве метода сбора данных, какие шаги и в какой последовательности следует предпринимать?

Опросное исследование включает 14 основных видов процедур⁵. На практике может производиться сразу несколько процедур одновременно, и исследователь вправе по ходу опроса при необходимости возвращаться назад к той или иной процедуре или, наоборот, “перескакивать” вперед. Этапы опроса могут быть описаны следующим образом:

1. Концептуализация – определение цели исследования, выдвижение гипотез, уточнение понятий и нахождение их операциональных соответствий в данном опросе (операционализация).

2. Схематизация – установление процедур, которые должны быть применены во время опроса, и принятие решения о характере требуемой выборки.

3. Подготовка инструментария – составление анкеты или бланка интервью, определение числа и порядка вопросов, подготовка необходимых наглядных пособий или любых других подсобных средств.

4. Планирование – рассмотрение финансовых, административных, материально-технических и кадровых проблем, связанных с проведением опроса.

5. Построение выборки – отбор предполагаемых респондентов в соответствии с тем из методов, описанных в гл.5, который лучше других подходит для целей и средств данного исследования.

6. Инструктаж – подготовка интервьюеров, кодировщиков и другого обслуживающего опрос персонала к работе с респондентами и к обработке данных; снабжение персонала необходимыми материальными средствами.

7. Предварительное тестирование (pretesting) – опробование выбранного инструментария на выборке малых размеров с целью проверки правильности понимания респондентами инструкций и вопросов, а также проверки соответствия их ответов ожидаемому типу ответов. [c.185]

8. Опрос – почтовый, телефонный или очный опрос участников выборки с применением пилотажного инструментария.

9. Наблюдение за ходом опроса (мониторинг) – проверка корректности применения методики опрашивающими, а также контроль за тем, чтобы опрашивались строго только участники выборки (проверка записей интервьюеров, случаев отказа респондентов от опроса; прослушивание телефонных интервью).

10. Контрольная проверка – проверка (посредством дополнительных контактов с респондентами) того, все ли члены выборки оказались реально охвачены опросом и всели из них возвратили анкеты.

11. Кодирование – преобразование собранных данных в числовую форму.

12. Обработка – подготовка данных для анализа.

13. Анализ – переработка данных с помощью статистических и других средств с целью получения содержательных выводов.

14. Составление отчета – изложение результатов анализа в форме исследовательского отчета.

Далее в этой главе мы осветим некоторые основные моменты, которые исследователю следует принимать во внимание при проведении каждой из вышеупомянутых процедур. [c.186]

КОНЦЕПТУАЛИЗАЦИЯ

На этом этапе происходит сведение общего исследовательского вопроса к набору более конкретных вопросов, доступных для эмпирического изучения. При этом исследователю следует руководствоваться правилами, изложенными в гл. 2 и 3. От обсуждавшихся там процессов концептуализация отличается только тем, что в случае опроса операционализация понятий должна быть увязана с конкретной методикой сбора данных. Подробнее мы рассмотрим это требование при обсуждении инструментария и способов формулирования вопросов.

Решения, принятые на стадии концептуализации, весьма существенны для следующих этапов – схематизации опроса и построения выборки. Например, принимая решение о том, к какой группе населения приложима наша концепция, мы тем самым определяем приблизительные [c.186] границы нашей будущей выборки. Выбирая операционализацию, требующую очного интервьюирования, мы заранее ставим для себя условием обеспечение высокого уровня опроса. Лишь только приступая к обдумыванию теоретических аспектов исследования, мы уже должны сообразоваться с грядущими проблемами, например с проблемой наличных средств и с проблемой доступности респондентов. [c.187]

СХЕМАТИЗАЦИЯ ОПРОСА

По своим целям опросы делятся на поисковые, описательные и объяснительные. Поисковый опрос помогает получить информацию, необходимую для более точной формулировки исследовательских вопросов и гипотез в том случае, если об изучаемом явлении известно недостаточно. Описательный опрос способствует точному измерению важных для теории переменных, но не дает основания для выводов о причинных связях. Объяснительный опрос способствует проверке гипотез о причинных связях и помогает понять наблюдаемые закономерности в свете теории. Он должен быть построен так, чтобы исключать любую конкурирующую гипотезу. Данные для каждого из этих типов опроса могут быть получены с помощью очного интервьюирования, телефонного интервьюирования, почтового и прессового анкетирования. Первые шаги в подготовке опроса заключаются в принятии решения о цели опроса и в выборе подходящего для этой цели способа сбора данных. Выбор цели в значительной степени обусловлен уровнем нашего теоретического и эмпирического знания о предмете. Характер методики сбора данных определяется, во-первых, выбранной нами операционализацией, а во-вторых, нашими материальными возможностями. Ниже мы еще поговорим об этом.

В качестве следующего шага нам предстоит избрать способ организации опроса. Основная дилемма, стоящая здесь перед нами, – предпочесть ли перекрестную (cross-sectional) или же лонгитюдную схему обследования⁶. При перекрестном опросе сбор данных производится всего один раз. При условии наличия репрезентативной выборки это позволяет описывать группы населения и отношения между переменными в этих группах в строго определенный момент времени, но лишает [c.187] нас возможности видеть развитие этих групп и отношений во времени. Перекрестный опрос предоставляет нам как бы моментальный снимок движущегося объекта. Такой тип более подходит для поискового или описательного опроса, однако при наличии хорошо разработанной теории и при надлежащем анализе данных он может сослужить неплохую службу и в объяснительном исследовании. Например, при изучении зависимости между типом личности и ее политическим поведением у нас может возникнуть желание утверждать, что уровень самоуважения является относительно устойчивой личностной чертой, лежащей в основе политической активности индивида. Если мы далее, в ходе опроса, установим, что лица с высоким уровнем самоуважения, как правило, более политически активны, чем лица с низким уровнем самоуважения, то у нас появится веское основание настаивать на том, что высокий уровень самоуважения приводит к (или является причиной) повышенной политической активности, несмотря на то что сбор данных, которыми мы располагаем, носил разовый характер.

При лонгитюдном опросе сбор данных производится более одного раза. Основные виды лонгитюдного опроса – это трендовое, когортное и панельное обследования.

В трендовых обследованиях в разное время опрашиваются члены нескольких разных выборок, составленных из представителей одной и той же совокупности (например, из избирателей штата Канзас). При этом каждый раз в опросе могут участвовать разные лица, но результаты всего обследования будут репрезентативно отражать тенденцию развития одной и той же совокупности в целом, поскольку, как уже говорилось в гл.5, каждая правильно построенная выборка будет эквивалентна любой другой выборке из данной совокупности. Так, например, если мы в результате проведенных в разное время опросов членов двух выборок из одной и той же группы населения выясним, что степень политических пристрастий респондентов в этих двух выборках неодинакова, то это будет значить, что за тот промежуток времени, который разделяет эти опросы, в степени политических пристрастий данной группы населения в целом произошли изменения. С помощью трендового обследования можно также изучать изменения, происходящие в зависимостях между переменными. Если [c.188] мы, к примеру, обнаруживаем, что из двух опросов, проведенных на выборках из одной и той же группы населения, зависимость между полом респондента и его политической активностью во втором выражена слабее, то можно заключить, что перед нами налицо тенденция к ослабеванию роли фактора пола в политической жизни данной группы населения.

Когортное обследование отличается от трендового тем, что, в то время как последнее репрезентативно по отношению к крупным группам населения или к населению в целом (например, к совокупности американских женщин, французских избирателей, алжирских студентов), первое нацелено на изучение во времени частных, специфических групп. Например, нам нужно сделать выборку из совокупности всех мексиканских граждан, легально иммигрировавших в США в 1985 г., а затем произвести выборку из той же самой группы тремя годами позже с целью определить степень ее адаптации к жизни в США. Хотя при этом в данной группе может наблюдаться некоторое уменьшение числа членов (за счет смертей или отъезда из США), однако новых членов не прибавится.

Как трендовое, так и когортное обследование помогает нам зарегистрировать изменение группы населения во времени, но. поскольку для каждого опроса строится своя выборка, мы не в состоянии определить, каких конкретно членов данной группы касаются наблюдаемые изменения. Это затрудняет выявление имеющихся причинных связей. В панельном обследовании в противоположность этому используется одна и та же выборка, обследуемая в разные моменты времени, что позволяет увидеть, каких членов группы касаются изменения, и определить те особенности личности или опыта респондента, которые связаны с этими изменениями. Например, мы можем проинтервьюировать членов одной и той же выборки из общей совокупности зарегистрированных в округе избирателей до, во время и после избирательной кампании, с тем чтобы установить, какие аспекты кампании в наибольшей степени повлияли на изменения во мнениях избирателей о кандидатах.

Однако наряду с этим важным преимуществом панельное обследование обладает и некоторыми недостатками. Во-первых, оно требует больших материальных издержек, поскольку не терять членов выборки из виду в течение длительного времени плюс опросить их несколько раз стоит недешево. [c.189] Во-вторых, при панельном обследовании исследователь может столкнуться с проблемой реактивности того типа, который описан в гл.4. Уже сам факт того, что человека несколько раз опрашивают по одному и тому же поводу, может вызвать у него желание изменить свое мнение или поведение, чего он, возможно, и не стал бы делать, если бы не опрос. Такая реакция может привести к искажениям в результатах. Во всяком случае, существует риск того, что данная выборка, включенная в исследование, перестанет быть репрезентативной по отношению к генеральной совокупности. В-третьих, валидность панельного исследования может быть поставлена под сомнение за счет убывания выборки. Убывание имеет место тогда, когда респонденты, опрошенные в первый раз, в последующие разы не опрашиваются. Если же те, кто выпадает из опроса, обладают такими релевантными для исследования особенностями, какими те, кто не выпадает из опроса, не обладают, то это может привести к сильно смещенной выборке, что вызовет смещение в результатах и одновременно не позволит экстраполировать их на генеральную совокупность.

Несмотря на эти недостатки, панельное обследование является самым действенным методом из тех, что используются в объяснительных исследованиях, и чаще всего окупает все расходы за счет той дополнительной информации, которую оно приносит.

Особым типом лонгитюдного обследования является экспериментальное обследование, при котором исследователь вызывает изменения в одной или нескольких независимых переменных в промежутке времени между первым и вторым опросами либо подгоняет опросы ко времени до и после некоторого ожидаемого изменения независимой переменной (например, до и после введения в действие нового закона или до и после избрания нового президента страны). Такое обследование может быть использовано в качестве полевого эксперимента и бывает особенно полезно при оценке той или иной правительственной политики. [c.190]

ПОДГОТОВКА ИНСТРУМЕНТАРИЯ

Какую бы схему опроса мы ни избрали, нам в любом случае нужно будет разработать серию вопросов, используемых в качестве рабочего средства для получения [c.190] необходимых измерений. Эта процедура представляет собой продолжение процесса операционализации понятий, начатого на этапе концептуализации; целью ее является разработка инструментария опроса, т.е. либо анкеты, которую респондент заполняет самостоятельно, либо бланка интервью, который заполняется интервьюером в ходе проведения интервью.

При разработке инструментария исследователю следует обращать внимание на: (а) содержание, (б) тип, (в) форму, (г) словесную формулировку и (д) порядок вопросов. Содержание вопроса обусловливается общей исследовательской проблемой или гипотезой и в свою очередь определяет ту информацию, которая может быть получена из ответа. Что нужно знать, чтобы подтвердить гипотезу, и какие вопросы нужно задать, чтобы получить необходимую информацию? Очень важно уметь ясно себе представлять одновременно и то, какую информацию мы желаем получить в ответ на каждый вопрос анкеты, и то, как эта информация будет использована при анализе данных, что нового она внесет в наши знания об объекте исследования.

Почти о любом предмете можно задать массу самых разных вопросов, однако для того, чтобы респондент был в состоянии заполнить анкету, она должна быть относительно короткой. Очные интервью, как правило, должны длиться не более 45 минут, а телефонные – не дольше 20 мин. Анкета, пересылаемая по почте, вообще не должна превышать четырех страниц. Стремление к краткости, однако, не должно преобладать над необходимостью формулировать вопросы так, чтобы исключить конкурирующие гипотезы, которые могут возникнуть при анализе данных. Для решения этой проблемы можно посоветовать следовать двум общим правилам. Во-первых, число гипотез или исследовательских вопросов, изучаемых посредством опроса, должно быть сведено к минимуму; это позволит ограничить число переменных, по которым необходимо получить информацию. Во-вторых, отбирая вопросы, отсеивайте те из них, роль которых в предстоящем анализе данных вам заранее неясна.

Опросы обычно включают в себя как вопросы, специфические для данного исследования, так и вопросы общего, “фонового” характера, предназначенные для измерения тех параметров, которые – как это бывает ясно из данных предыдущих исследований – непосредственно [c.191] связаны с различительными признаками изучаемого типа политического поведения. Общие вопросы включаются в анкету для того, чтобы исключить конкурирующие гипотезы, относящиеся к таким “фоновым” параметрам, и чтобы уточнить наше понимание существующих зависимостей, проследив за тем, как они различаются в разных демографических группах. Практически в любой опросный инструментарий включаются (или по меньшей мере рассматриваются на предмет включения) вопросы, касающиеся следующих параметров:

Пол
возраст
расовая принадлежность
доход
вероисповедание
образование
род занятий

семейное положение
состав семьи
недвижимое имущество
партийность
национальность
срок проживания в данной местности
членство в общественных организациях

Тип вопроса определяется тем, имеет ли он открытый или закрытый набор возможных ответов. На вопрос с открытыми возможностями для ответа, или открытый вопрос (open-ended question), респондент волен отвечать своими словами; никакие варианты ответа извне ему не навязываются. Пример такого рода вопроса: “Какая проблема, по Вашему мнению, будет в этом году самой важной на местных выборах?” У подобных вопросов то преимущество, что они позволяют обнаружить непредвиденные повороты в ответах респондентов. Кроме того, они помогают избежать искажения информации, возникающего зачастую за счет наличия недоговоренности или тенденциозности в вариантах ответов, заранее подобранных исследователем. Однако у вопроса с открытыми возможностями для ответа есть и свои недостатки. Дело в том, что он сильно затрудняет сравнение ответов между собой, поскольку каждый респондент при ответе может исходить из своей уникальной, отличной от остальных “системы координат”. Кроме того, такие вопросы могут приводить к пустым или бестолковым ответам, к ответам не по существу или просто длинным, сложным для анализа.

Отвечая на вопрос с закрытым набором возможных ответов, или закрытый вопрос (closed-ended question), респондент [c.192] вынужден выбирать ответ из ограниченного числа предлагаемых в анкете вариантов. Вопросы этого типа легко поддаются сравнению и дальнейшей обработке, они исключают возможность появления не относящихся к делу ответов. Пример вопроса с закрытым набором возможных ответов: “Кем Вы себя считаете: (1) консерватором, (2) умеренным, (3) либералом?” Варианты ответов должны быть в совокупности исчерпывающими (т. е. они должны включать все ответы, какие только можно предугадать) и взаимоисключающими (т. е. на каждый вопрос должно допускаться не более одного варианта ответа). Кроме того, респонденту следует предоставить возможность отражать в ответе степень своей оценки в тех случаях, когда это является значимым. Такой вопрос, как, например: “Некоторые считают, что клиники, в которых производятся аборты женщинам из неимущих слоев, должны содержаться за счет федерального правительства. Согласны ли Вы с таким мнением?” – предполагает более широкий набор потенциальных ответов, чем просто “согласен” и “не согласен”. Спектр возможных оценок, наверно, лучше отразит ряд типа “полностью согласен”, “согласен”, “отношусь нейтрально”, “не согласен”, “совершенно не согласен” и “не знаю”.

Даже тогда, когда вопрос с закрытым набором возможных ответов построен хорошо, не исключен риск того, что подобранные исследователем варианты ответов могут повлиять на ответ респондента, а это явно нежелательно. Например, вопрос, подобный следующему: “Какая из приводимых ниже проблем, стоящих сегодня перед США, является, по Вашему мнению, самой важной?” – сам по себе уже подразумевает невозможное, а именно: будто исследователь в состоянии перечислить на выбор все мыслимые проблемы; тем самым использование в данном случае закрытого набора вариантов ответов может помешать обнаружить какую-то непредвиденную нами точку зрения. Выбор между двумя вышеописанными типами вопросов должен осуществляться с учетом как доступных нам средств обработки данных (“открытые” вопросы требуют более сложной обработки), так и теоретических и эмпирических знаний о предмете (“закрытые” вопросы требуют лучшей осведомленности о предмете).

Форма вопроса относится к способу его презентации. Помимо наиболее обычной формы: “устный (письменный) вопрос – устный (письменный) ответ”, – существует [c.193] целый ряд других способов, помогающих респонденту понять, о чем его спрашивают, и сделать сознательный выбор при ответе. Многие способы связаны с использованием наглядных пособий, таких, как схемы, фотографии, карточки с надписями и рисунками. Один из примеров – “термометр ощущений”, разработанный в Опросном научно-исследовательском центре Мичиганского университета. Респонденту предъявляют карточку с изображением “термометра ощущений” (см. рис.6.1) и просят оценить, какие ощущения – “горячие” или “холодные” – у него вызывает тот или иной объект (например, демократическая партия или мэр города, где он проживает), указывая на соответствующее показание “термометра”. Такое наглядное пособие помогает респонденту упорядочить большее число возможных вариантов (например, всех кандидатов на пост президента страны), чем он это мог бы сделать в уме. Процедура состоит в том, что исследователь просто спрашивает мнение респондента отдельно по [c.194] каждому варианту, а затем сравнивает показания “термометра”. Вообще, чем более сложные умственные операции требуются от респондента, тем полезнее могут оказаться наглядные пособия и другие варианты вопросно-ответной формы.

Рис. 6.1. “Термометр ощущений” как пример наглядного пособия

Решающим фактором успеха всего опроса является правильная словесная формулировка вопросов. Ведь если вы не сумеете точно сформулировать интересующий вас вопрос, то и полученный вами ответ не будет соответствовать тому роду данных, которые нужны для проверки вашей гипотезы. Если вопросы задаются таким образом, что они поощряют одни ответы в ущерб другим, то и результаты опроса будут отражать не столько реальный мир, сколько выбор, внушенный самой структурой вопроса. Конечно, в разных исследовательских проектах и вопросы предполагаются разные, но, несмотря на это, мы можем предложить несколько общих правил составления пунктов опроса, способных обеспечить надежные и достоверные результаты. (Более подробно правила формулирования вопросов излагаются в гл.7.)

Во-первых, во всех случаях, когда это не наносит урон содержанию исследования, старайтесь включать те вопросы и понятия, которые были успешно использованы в предыдущих исследованиях. В настоящее время в политологии существует целый ряд хорошо разработанных и всесторонне опробованных в плане их надежности (валидности) стандартизованных мер понятий (measure of concept) из числа часто применяемых на практике⁷. Использование их в опросе избавляет исследователя от необходимости разрабатывать какие-то новые меры; кроме того, это позволяет сравнивать результаты разных исследовательских проектов.

Во-вторых, прежде чем включать какой-то вопрос в опросный лист, проверьте, могут ли вообще данные респонденты располагать информацией, необходимой для ответа на него. Не спрашивайте респондента о том, чего он заведомо не испытал или не знает, а если возникает сомнение в компетентности респондента, то для ее проверки можно воспользоваться пробными вопросами. В порядке пробы респондента сначала выясняют его уровень знания предмета, а затем просят выразить свое мнение об этом предмете или высказать суждение о нем. Например, можно [c.195] спросить: “Скажите, пожалуйста, какова позиция кандидата Смита по вопросу о торговле с ЮАР?” – и, если респондент ответит правильно, задать следующий вопрос:“Вы согласны с такой позицией?” Такой прием позволяет удостовериться в том, что респондент не будет говорить о том, чего он не знает, например из нежелания признаться в своем незнании.

В-третьих, зачастую полезнее, чем вопросы, могут оказаться утверждения о предмете. При этом исследователь обыкновенно просит респондента сказать, в какой степени он согласен или не согласен с серией утверждений, подобранных так, чтобы отразить различные точки зрения по интересующему исследователя предмету. Такая форма имеет ряд преимуществ по сравнению с просто вопросами. С одной стороны, она предоставляет исследователю простое средство измерения интенсивности оценок в тех случаях, когда это важно. С другой стороны, она помогает добиться того, чтобы все респонденты в своих ответах исходили из одной “системы координат”, что увеличивает надежность и достоверность измерений. Кроме того, утверждения на различные темы могут быть перемешаны так, чтобы респондент не догадался, к чему в конечном счете клонит исследователь. Если, к примеру, целью опроса является определить степень согласованности декларируемых респондентами взглядов на гражданские свободы с их терпимостью или нетерпимостью по отношению к отклоняющимся от нормы социальным группам, то серия вопросов, последовательно вытекающих друг из друга, может побудить респондента увидеть неувязки в своих ответах и устранить их, невзирая на то, каково его мнение в действительности. Вместе с тем серия утверждений, выявляющих ту же самую зависимость, но перемежающихся утверждениями на другие темы, не дает разглядеть очевидной закономерности и легко сбивает с толку чересчур догадливого респондента. Наконец, утверждения по сравнению с вопросами легче использовать при построении сложных мер отношений, называемых шкалами или индексами (см. гл.8).

В-четвертых, используя утверждения вместо вопросов, помните, что респонденты имеют обыкновение соглашаться с утверждениями исследователя независимо от своей собственной точки зрения. Эта закономерность называется [c.196] ответной тенденцией (response set), и в тех пунктах опроса, в которых она не учтена, проявляется сдвиг в сторону ответной тенденции (response set bias). Этот феномен легко заметить, если пытаться измерить степень политического консерватизма сначала с помощью шести утверждений, с которыми консервативно настроенные лица по идее должны согласиться, а затем снова с помощью других шести утверждений, с которыми эти лица, скорее всего, не согласятся. Первое измерение почти наверняка “покажет” значительно больший процент консерваторов, чем второе, вне зависимости от реального числа консерваторов в выборке. Пункты опроса следует перемешивать между собой так, чтобы иногда ожидалось согласие, а иногда несогласие с той или иной точкой зрения или отношением.

В-пятых, измерение переменной с помощью одного-единственного пункта опроса может вызвать смещение в результатах. Например, если для измерения степени недовольства населения мерами по устранению расовой сегрегации в школах руководствоваться только ответами на один-единственный вопрос: “Вы одобряете совместную перевозку школьников на автобусах, невзирая на расовую принадлежность?”– то в результате можно переоценить степень общественной оппозиции ввиду того, что респонденты лишены в этом вопросе возможности рассмотреть все те аргументы “за” и “против”, которые в реальной ситуации, возможно, смягчили бы их позицию⁸. Для измерения отношений, которые могут служить основанием для действий в целом, более предпочтительно использовать сразу несколько пунктов опроса и формировать индекс или шкалу (как это показано в гл.8).

Помимо составления отдельных пунктов опроса, исследователь должен подумать и об организации опросного инструментария в целом. Добротные анкеты и бланки интервью обычно состоят из четырех основных частей: вводной части, нескольких вопросов для разминки, основных вопросов и биографических вопросов. (В случае очного интервью имеет место также предварительная часть, во время которой интервьюер выясняет, соответствует ли респондент требованиям данной выборки, и получает его согласие на проведение интервью. Мы еще вернемся к этому в гл.7 при разговоре о подготовке интервьюеров.) [c.197]

Во вводной части респонденту разъясняются задачи исследования, так чтобы убедить его в важности опроса и в том, что опрос заслуживает того, чтобы потратить на него время. Зачастую это удается сделать посредством апелляции к какой-нибудь высокой цели или к общепризнанному авторитету. Если у опроса имеется влиятельный спонсор, то желаемый эффект может произвести фраза типа: “Государственный отдел по трудоустройству поручил нам...” или “Мы проводим опрос для института социологических исследований...”. Объясняя задачу исследования, важно стараться избегать специальных терминов, не употребляющихся респондентами в повседневном общении. Например, было бы неразумно обращаться к респонденту со словами: “Мы проводим исследование связей между массами и элитой с целью определения, в какой степени формальные механизмы представительства являются ширмой для социального контроля со стороны политической элиты”, – даже если это высказывание отражает реальную цель исследования. Правильнее было бы сказать иначе: “Мы хотим выяснить, какие у вас – и у таких людей, как вы, – имеются контакты с выборными представителями власти, и мы надеемся, что результаты этого исследования помогут улучшить работу нашего правительства”. Не рекомендуется лгать респондентам, но вместе с тем во вводной части нельзя раскрывать ту информацию, которая может привести к искажениям в ответах. Если респонденту сообщить, что объектом исследования являются расовые предрассудки, то он будет давать иные ответы, чем если ему сказать, что исследование касается просто отношений между гражданами или какой-нибудь другой нейтральной темы.

Вводная часть может помочь интервьюеру установить хороший контакт с респондентом, а также развеять возможные опасения последнего относительно того, не служит ли опрос прикрытием для каких-либо неблаговидных целей.

Разминочные вопросы тоже помогают достичь непринужденности в общении с респондентом. Это беспристрастные, нейтральные вопросы, задающиеся с целью завязать беседу. Для разминки хорошо бывает спросить респондента о том, давно ли он живет в данной местности, или о том, какие наиболее актуальные проблемы стоят, по его мнению, перед страной или перед его округом. Однако каждый вопрос, [c.198] отобранный в качестве разминочного, должен быть релевантен для данного исследования и должен играть свою определенную роль в анализе, иначе он пропадет втуне. Поэтому разминочные вопросы не выискивают специально, а отбирают из числа основных вопросов.

Основные вопросы составляют ядро опросного инструментария. Порядок пунктов внутри этой группы определяется главным образом необходимостью придерживаться логического хода опроса. Порядок вопросов отнюдь не всегда неважен. Случается, что исследователь хочет задать один и тот же вопрос несколькими способами. При этом различные модификации этого вопроса не должны занимать смежные места в опросе, чтобы респондент не счел их избыточными. Подобным же образом если некоторое явление нуждается в том, чтобы о нем были заданы как общие, так и частные вопросы, то сначала лучше задать общий вопрос, чтобы получить ответ, не обусловленный рядом частных уточнений. Кроме того, вопросы с открытыми возможностями для ответа имеет смысл помещать перед вопросами с закрытым набором возможных ответов, касающимися той же темы, чтобы варианты ответов, предлагаемые в вопросах “закрытого” типа, не могли искажающе повлиять на ответы на вопросы “открытого” типа. Если есть основание полагать, что порядок вопросов будет влиять на ответы, то проверить это можно в ходе предварительного тестирования.

Биографические вопросы имеют целью получение фактических данных о респонденте; иные из них подчас считаются сугубо личными. Эти вопросы обычно помещаются в конец опроса, чтобы у респондента не возникло раньше времени впечатления, что исследователь сует нос не в свое дело, – это может помешать опросу. Хотя люди, как правило, довольно охотно сообщают сведения о своем доходе или семейном положении, получение адекватных ответов на биографические вопросы требует аккуратных словесных формулировок.

Помещение биографических вопросов в конец опроса имеет еще то дополнительное преимущество, что скучные вопросы, с какими людям обычно приходиться сталкиваться при заполнении всякого рода бланков, откладываются на потом, а сначала задаются интересные вопросы, и, таким образом, респондент не успевает сразу заскучать. [c.199] Это особенно важно при самостоятельном заполнении анкеты респондентом, потому что ряд шаблонных вопросов в самом начале, ассоциируясь с выполнением какой-то нудной работы, может отбить у респондента охоту заполнять анкету, тогда как вопросы, касающиеся важных проблем, могут, наоборот, возбудить его интерес к заполнению анкеты.

После того как мы разработали основные детали инструментария, нам надо принять решение, как лучше разместить их на бумаге. Это то, что определяет формат инструментария. Эрл Бэбби утверждает: “Формат анкеты, может быть, не менее важен, чем содержание и формулировка вопросов. Неправильная подача текста в анкете может привести к тому, что респонденты станут пропускать вопросы, неверно их понимать и даже в крайнем случае могут бросить заполнять анкету”⁹. Не менее важным может оказаться и формат бланка интервью. Плохо составленный бланк сбивает с толку интервьюера, заставляет его перескакивать через вопросы, неаккуратно фиксировать ответы и в итоге отталкивает респондента неуклюжим ведением интервью. Мы можем предложить несколько правил расположения анкеты или бланка интервью на бумаге.

Первое правило заключается в том, чтобы не скучивать на листе пункты опроса. Трудно переоценить урон, который может нанести опросу чересчур тесное расположение текста на странице. Во избежание ошибок на каждой странице опросного инструмента оставляйте как можно больше свободного места. В случае бланка интервью эта мера облегчит для интервьюера следование инструкции и фиксирование ответов. В случае самостоятельно заполняемой анкеты это поможет респонденту правильно прочитать и отметить нужные пункты, а кроме того, создаст у него впечатление, что заполнить анкету нетрудно. Уж лучше пусть анкета содержит много листов с несколькими пунктами опроса на каждом из них, чем несколько листов со многими пунктами опроса на каждом. Общее количество страниц в меньшей степени значимо, чем четкое расположение текста на каждой из них, однако нельзя не считаться и с тем эмпирическим фактом, что на заполнение 10 правильно составленных страниц опросного инструмента уходит примерно 30 минут, а это как раз то время, в течение [c.200] которого исследователю обычно удается задерживать внимание респондента.

При расположении материала на бланке интервью исследователь должен одновременно учитывать нужды интервьюера, кодировщика (который будет считывать информацию с заполненного листа) и тех, кто будет заниматься подготовкой этой информации для машинной обработки. Один из основных вопросов, встающих при этом, – пользоваться ли предварительно закодированным инструментом. Детально кодирование информации обсуждается в гл.12. В основе своей это операция придания числовых символов ответам, записанным в словесной форме. В предварительно закодированном опросном инструменте каждому ответу уже приписан свой числовой символ, чего нет в предварительно не закодированном инструменте. На рис.6.2 в качестве примера представлена часть предварительно закодированного бланка интервью. Мелкие цифры рядом с закодированными ответами обозначают ту колонку перфокарты, в которую должен быть внесен код. Стрелки указывают оператору, вводящему данные в компьютер, на необходимость перехода к другой строке или новому полю для ввода данных. [c.201]

Рис. 6.2. Отрывок предварительно закодированного бланка интервью
(пример вымышленный, по сравнению с реальным опросом вопросы несколько упрощены) [c.202]

Предварительное кодирование инструмента имеет два преимущества. Во-первых, оно в состоянии ускорить процесс интервьюирования, облегчая для интервьюера задачу фиксирования ответов. В большинстве случаев интервьюеру проще обвести в кружок или выписать числовой символ, обозначающий ответ, чем выписывать сам ответ. Это также способствует снижению числа ошибок при считывании и интерпретации заполненного бланка интервью. Во-вторых, предварительное кодирование позволяет оператору работать прямо с опросным инструментом после его заполнения; при этом из обработки устраняется лишняя процедура, связанная с переносом информации с опросного инструмента на какой-то другой носитель, приспособленный для ввода данных в машину.

Хотя существует много разных способов расположения материала на листе предварительно закодированного инструмента, тем не менее важно, чтобы все ответы были по возможности сосредоточены на одной стороне листа, так чтобы респонденты не обращали внимания на те цифры и стрелки, которые их не касаются. [c.201]

Один из самых важных моментов, который следует учитывать при предварительном кодировании, – это то, каким способом отождествить все листы и перфокарты, содержащие ответы одного и того же респондента. Как правило, каждому респонденту приписывается свой номер, отличный от остальных, и этот номер проставляется [c.203] в первых нескольких колонках всех перфокарт, содержащих данные опроса этого респондента. Номер также должен быть записан на каждой странице бланка интервью или анкеты, чтобы обработанные данные можно было сверять с необработанными. В том случае, если на респондента приходится две и более перфокарты, в последней колонке каждой из них указывается, которая это карта из числа всех, относящихся к данному респонденту.

Составление предварительной инструкции, обеспечивающей точное и упорядоченное заполнение опросного инструмента, – одно из самых трудных дел при подготовке инструментария. Интервьюер имеет возможность хорошо подготовиться и фактически выучить наизусть весь бланк интервью, да и то в сложных случаях ему без инструкции не обойтись. У респондента, самостоятельно заполняющего анкету, нет и такой возможности, потому что анкету он видит впервые. На рис.6.3 показан один из способов, помогающих респонденту ориентироваться в вопросах. Каждому ответу здесь приписан свой номер. Согласно инструкции, респондент должен обвести кружком номер, соответствующий его ответу, и далее оператор сможет прямо с листа ввести этот номер в машину. Стрелки указывают респонденту, в какой последовательности двигаться от вопроса к вопросу. [c.204]

Рис. 6.3. Отрывок почтовой анкеты (пример вымышленный)

ПЛАНИРОВАНИЕ ОПРОСА И ПОСТРОЕНИЕ ВЫБОРКИ

Разобравшись с форматом и содержанием опросного инструментария, исследователь может переходить к следующим этапам опроса – построению выборки и планированию. Методы построения выборки уже обсуждались выше, в гл.5, поэтому здесь мы их не будем затрагивать.

Этап планирования включает в себя:

1) принятие решения о типе предстоящего опроса;
2) разработку вопросов материально-технического обеспечения опроса;
3) разработку вопросов финансирования опроса.

Характер исследовательской проблемы определяет, какой тип опроса необходим, но то, какой тип возможен, диктуется наличием или степенью доступности соответствующих материальных средств. Опросная практика предоставляет нам на выбор четыре основных типа: очное интервьюирование, телефонное интервьюирование, [c.204] анкетирование по почте и опрос через прессу. Принимая то или иное решение, следует учитывать следующие особенности каждого из этих четырех типов опроса.

Очное интервьюирование – это самый гибкий тип, поскольку оно допускает использование самых разнообразных способов опрашивания (например, применение наглядных пособий), а также предоставляет интервьюеру возможность настойчиво добиваться от респондента ответа на каждый вопрос, одновременно разъясняя ему непонятные места. Кроме того, очное интервьюирование поставляет исследователю самый большой объем данных, в силу того что при личном общении интервьюер может, как правило, удерживать внимание респондента дольше, чем при телефонном разговоре или при анкетировании. Скорость получения ответов в очных интервью тоже обычно выше. Однако у этого типа опроса есть и свои недостатки. Прежде всего, он очень дорогостоящ, и только наиболее важные исследовательские проекты позволяют финансировать его. Еще одно неудобство состоит в том, что очные интервью иногда дают сильно искаженные результаты, что обусловлено спецификой самого процесса интервьюирования. Зафиксированные ответы могут отражать не столько реальный мир или реальные отношения, сколько воздействие на респондента обстановки, в которой протекает интервью, реакцию респондента на конкретного интервьюера и его стиль опроса, тенденциозность интервьюера и допускаемые им в процессе опроса ошибки или отступления от правил.

Кроме того, последовательный “от двери к двери” опрос трудно контролировать и контролировать качественно. Исследователь не имеет возможности наблюдать за работой интервьюеров в действии (в “полевых условиях”) и должен опираться на различные способы последующей обработки интервью, чтобы удостовериться, что опрос был проведен должным образом. Хотя такие способы как установление контактов с респондентами с целью проверить, были ли они действительно опрошены, а также сравнение ответов, полученных разными интервьюерами, могут дать определенный эффект, они все же не совсем надежны и отнимают много времени. [c.205]

Почтовый опрос – другой возможный тип опроса с целым рядом преимуществ:

1. Поскольку почтовые опросы стоят намного дешевле, чем очные, они допускают более широкий круг распространения опросного инструмента и, соответственно, большие выборки.

2. Почтовый опрос позволяет избежать многих неудобств, связанных с распространением опросного инструмента. К таким сложностям относится нежелание интервьюеров работать в определенных районах и их неумение брать интервью у индивидов или семей определенного типа.

3. Почтовый опрос позволяет также избежать тех искажений в результатах, которые обусловлены личными качествами интервьюера.

4. Благодаря анонимности, обеспечиваемой за счет распространения опросного инструмента по почте, ответы респондентов бывают более правдивыми.

5. При почтовом опросе у респондента больше времени на обдумывание ответов, которые соответственно в большей степени отражают его истинные настроения, чем ответы, порождаемые в спешке в ходе очного интервью.

6. За счет централизованности процедуры кодирования и большей стандартизации всех остальных процедур в почтовом опросе меньше риск дублировании ошибок при обработке данных.

7. Почтовый опрос требует меньшего количества обслуживающего персонала. Это позволяет сэкономить деньги и время, а также обеспечивает большую стандартизацию при обработке данных.

Но, к сожалению, у почтового опроса тоже есть свои ограничения. Прежде всего, этот тип опроса требует разработки единообразного опросного листа, рассылаемого по почте всем респондентам выборки, причем выборка должна быть достаточно представительной. Но подобного единого образца, одинаково приемлемого для опроса разных групп населения, данные о которых требуется обобщить, во многих случаях просто не существует. Во-вторых, для того чтобы опрос протекал достаточно быстро, анкеты должны быть короткими. Это значит, что от каждого контакта с респондентом может быть получено относительно небольшое количество информации. В-третьих, исследователь лишен возможности контролировать действия [c.206] респондента по заполнению анкеты. Это чревато, в частности, тем, что анкета может быть заполнена не по правилам или же каким-то другим лицом, не входящим в данную выборку; кроме того, процесс заполнения анкеты может неоправданно затянуться. В-четвертых, на почтовый опрос нельзя полностью положиться в отношении валидности получаемой информации. Ведь у респондента есть время, чтобы “подсмотреть” ответ на вопрос анкеты, особенно если это касается вопроса на проверку знаний (типа такого: “Как фамилия сенатора от Вашего штата?”). И наконец, существуют такие исследовательские проблемы, которые требуют усложненной техники опроса, доступной только опытному интервьюеру.

Телефонный опрос занимает промежуточное положение между очным и почтовым сразу в нескольких отношениях. Число задаваемых вопросов в нем обычно несколько больше, чем в почтовом опросе, но меньше, чем в очном. Скорость получения ответа, как правило, ниже, чем в очном, но выше, чем в почтовом опросе. Хотя источники искажения информации, обусловленные личностью интервьюера, устранены не полностью, все же голос в телефонной трубке менее способен привести к искажениям в ответах, чем живой человек. Наконец, и требования к подготовке обслуживающего персонала находятся в промежутке между тем, чего требует опрос очный, и тем, чего требует почтовый.

К преимуществам телефонного опроса принадлежат относительная быстрота получения ответа, наличие контроля над респондентом и хорошие возможности по обеспечению более адекватных ответов. Его основной недостаток связан с трудностью получения несмещенной выборки. Ведь те люди, у которых телефона нет или телефоны которых не указаны в телефонном справочнике, могут быть не менее релевантными для исследования, чем остальные. И поэтому исключение их из выборки может привести к искаженным результатам. Например, в справочнике часто не указываются домашние телефоны должностных лиц, а многие неимущие люди вообще не имеют телефонов. И это может решающим образом повлиять на итоги такого опроса, целью которого является, например, изучение зависимости между величиной личных доходов и политическим поведением индивида. То, в какой степени [c.207] при телефонном опросе достижима репрезентативность выборки, зависит в основном от особенностей той совокупности людей, в отношении которой требуется сделать обобщение. Смещение выборки, связанное с отсутствием некоторых телефонных номеров, удается преодолеть с помощью метода рандомизированного набора телефонных номеров (random digit dialing) (т. е. с применением датчика случайных чисел), который к тому же увеличивает скорость проведения телефонного опроса¹⁰. Организации, профессионально занимающиеся телефонными опросами, широко используют специально разработанные компьютерные технологии. Их применение позволяет сократить число ошибок, так как, во-первых, пользуясь программой, интервьюер точно следует от вопроса к вопросу, а во-вторых, ответы запоминаются автоматически, по мере того, как они заносятся опрашивающим. Современное оборудование также используется для высококачественного контролирования. Для этого существует 2 способа. Первый: контролер группы может прослушивать любое интервью в любое время, чтобы исправить замеченную ошибку спрашивающего. Второй: поскольку данные заносятся в компьютер по мере поступления, легко заметить, в какой мере репрезентативна получаемая информация и внести необходимые коррективы еще в ходе работы. [c.208]

ПРОБЛЕМЫ, СВЯЗАННЫЕ С ФИНАНСИРОВАНИЕМ ОПРОСА

После того как исследователь определил, какой тип опроса позволит получить наиболее полные и надежные данные по интересующему его вопросу, решающим становится поиск необходимых для опроса финансовых средств. Финансированием политологических исследований занимаются как государственные учреждения, так и частные фонды, основываясь при этом на рассмотрении развернутых предложений научных проектов. В поиске возможных спонсоров успех может зависеть от:

(а) наличия финансирующей организации, которая оказывает поддержку исследованиям предлагаемого типа;
(б) тщательности в подготовке такого развернутого плана исследования, в котором бы ясно и убедительно демонстрировалась его обоснованность и научная значимость;
(в) наличия у финансирующей организации нужных фондов в момент предложения ей проекта, а также от [c.208] наличия у нее намерения вложить средства именно в проект предлагаемого типа.

Профессиональный политолог почти всегда имеет возможность связаться с соответствующими подразделениями своего института, которые располагают информацией о доступных на данный момент источниках финансирования и могут помочь в подготовке развернутой заявки о проекте. Разработка ее составляет основную часть этапа планирования, однако, прежде чем она может быть написана, должны быть продуманы все детали материально-технического обеспечения опроса, с тем чтобы в заявку можно было включить четкий план организации опроса и его подробный бюджет. В плане организации исследование делится на целый ряд частных подзаданий, для каждого из которых указываются сроки исполнения и ответственные исполнители. Кроме того, в этом плане оговаривается порядок осуществления централизованного контроля за поступающими данными и порядок отчетности всех исполнителей перед руководителем (руководителями) проекта. В бюджете должны быть перечислены все намечаемые в проекте статьи расходов. Основные их виды – это затраты на оплату труда руководящего и обслуживающего персонала, транспортные услуги, услуги средств связи, обучение персонала, кодирование и проверку данных, оборудование, секретарские и конторские услуги, эксплуатацию компьютеров и других средств обработки данных. [c.209]

ОБУЧЕНИЕ И ИНСТРУКТАЖ ПЕРСОНАЛА

Обучение и инструктаж персонала – один из важнейших этапов подготовки опроса, поскольку отдельные ошибки и оплошности в работе кодировщиков, интервьюеров и других сотрудников могут привести к несостоятельности результатов опроса в целом. Располагая достаточными средствами, исследователь может обратиться к услугам фирмы, специализирующейся на проведении опросов и имеющей в своем штате опытных интервьюеров; имея дело с таким персоналом, исследователю остается проинструктировать его только в том, что касается особенностей применения конкретного опросного инструментария. При более скромных материальных возможностях исследователю приходится пользоваться услугами интервьюеров, работающих по совместительству (обычно это бывают студенты), которых – прежде [c.209] чем допускать к полевой работе – надо предварительно обучить. Большая часть сведений о технике интервьюирования, которые могут понадобиться исследователю при обучении интервьюеров, содержится в гл.7. Здесь же мы хотели бы затронуть только вопрос о том, как подготовить интервьюера к вспомогательным операциям, связанным с проведением интервью.

Прежде всего у каждого интервьюера должна быть своя папка-скоросшиватель, где должны находиться все материалы, касающиеся опроса, а именно:

1. Листы бланка интервью; причем начало интервью с каждым новым респондентом хорошо бы отмечать листом цветной бумаги, чтобы легче было ориентироваться;

скалывать скрепками листы отдельного интервью можно лишь после его завершения.

2. Карта района, где будет работать интервьюер, с пояснениями, как ему найти адреса нужных респондентов.

3. Рекомендательное письмо, предъявляемое респонденту в том случае, если он захочет удостовериться в цели интервью.

4. Все необходимые наглядные пособия.

5. Лист, на котором фиксируются детали договоренности с тем или иным респондентом (или семьей) о сроках посещения его (ее) интервьюером (в том числе повторного посещения).

6. Набор ручек, заправленных чернилами какого-нибудь темного цвета, чтобы он контрастировал одновременно и с белой бумагой, и с черным типографским шрифтом бланка интервью (это сразу облегчает фиксирование ответов и кодирование).

Папка-скоросшиватель позволяет интервьюеру по ходу интервью оперативно вынимать и вкладывать обратно нужные листы.

На оборотной стороне первого листа каждого бланка интервью должно быть предусмотрено место для фиксирования причин и обстоятельств возможного отказа респондента от интервьюирования, для описания обстановки, в которой протекает интервью (шумно, мешают посторонние и т. п.), и общей реакции респондента (настроен враждебно, дружелюбно, недоверчиво).

Укомплектовав папку необходимыми материалами, неплохо испытать ее в работе на ком-нибудь из знакомых [c.210] или коллег, чтобы откорректировать имеющиеся погрешности, и лишь потом давать ее интервьюерам. Затем следует проинструктировать интервьюеров относительно того, как пользоваться этими материалами. Для лучшего понимания надо инструктировать одновременно не более пяти интервьюеров; таким образом, если проект крупный, на инструктаж может понадобиться несколько занятий. Иногда бывает полезно показать интервьюерам фильм или продемонстрировать им на практике, как правильно проводить интервью. В любом случае, а особенно тогда, когда интервьюеры совсем неопытны, исследователь должен проследить, чтобы каждый интервьюер в его присутствии потренировался в ведении интервью на ком-нибудь из других членов группы; исследователь при этом должен проверять правильность понимания интервьюером соответствующих процедур. [c.211]

ПРЕДВАРИТЕЛЬНОЕ ТЕСТИРОВАНИЕ

Предварительное тестирование опросного инструментария и всех сопутствующих процедур организации опроса столь же важен для успеха исследования, как пробная поездка – для успешной покупки подержанного автомобиля. Он помогает обнаружить проблемы, которые в полной мере могут проявиться только в реальных полевых условиях.

Предварительное тестирование проводится с помощью опроса небольшой выборки респондентов, сходных по ряду свойств с теми, которые будут опрашиваться в составе большой выборки. Выборка в предварительном тестировании не обязательно должна быть представительной в отношении более крупной группы населения. Куда важнее, чтобы она была построена таким образом, чтобы в процедуру предварительного тестирования оказались включенными члены всех таких групп респондентов, которые способны реагировать на инструментарий по-разному. Если, к примеру, имеются основания полагать, что малообразованные люди будут испытывать трудности в пользовании инструментарием, исследователь должен приложить все усилия, чтобы включить в предварительное тестирование респондентов с низким уровнем образования, даже если они составляют лишь незначительную часть исследуемой группы населения. [c.211]

Предварительное тестирование может служить как для тестирования инструментария, в котором исследователь вполне уверен, так и в целях усовершенствования инструментария в ситуации, когда предмет исследования хуже известен исследователю. В первом случае инструментарий проходит предварительное испытание в своем окончательном варианте. Во втором же случае исследователь может захотеть поэкспериментировать с разными вариантами (макетами) инструмента, чтобы узнать, какой из них удобнее в работе. Предварительное тестирование такого типа может включать в себя:

1. Тестирование различных словесных формулировок и форм вопросов.

2. Опробование анкеты, предназначающейся для самостоятельного заполнения респондентом, в очном интервью, чтобы в процессе живого общения с респондентом выявились возможные трудности ее заполнения.

3. Употребление открытых вопросов для выявления типичных ответов, которые затем можно будет включить в набор ответов на закрытые вопросы, с тем чтобы использовать последние в окончательном варианте.

4. Тестирование различных видов инструментария (почтовых анкет, очных интервью, телефонных интервью) с целью определения годности каждого из них.

После внесения в инструментарий коррективов исследователю следует еще раз опробовать его в предварительном тестировании, чтобы выяснить, не сохранилось ли в нем каких-либо недочетов и не возникло ли новых ошибок.

При предварительном тестировании инструмента, рассчитанного на интервьюирование, исследователь может сам провести ряд интервью, чтобы почувствовать инструмент в работе и чтобы увидеть, сколь он эффективен в работе с типическими респондентами. Если это невозможно, то исследователь по крайней мере должен сразу после того, как интервьюеры вернутся с опроса, сесть с каждым из них за стол и еще раз детально просмотреть весь инструмент и сопутствующие процедуры, чтобы установить, в каких пунктах инструкция неясна, какие конкретно процедуры неуклюжи или неудобны в применении, какие вопросы смущают или сбивают с толку респондентов.

Зачастую предварительное тестирование является способом проверки не только опросного инструмента, но и [c.212] техники взятия выборки, а также процедур оперирования с данными. Если в результате применения интервьюером предписанной выборочной техники выясняется, что выборка в предварительном тестировании совершенно нерепрезентативна или что число отобранных респондентов неоправданно мало, то применимость данной выборочной техники в данной исследовательской ситуации ставится под вопрос и требует пересмотра. Если интервьюер, используя отобранные для предварительного тестирования процедуры, испытывает затруднения в фиксировании и получении данных, то для массового полевого исследования следует разработать другие процедуры.

Иногда, когда социологи и политологи предполагают осуществить совершенно новый для них проект исследования, они должны взять на вооружение процедуру пилотажного исследования. Пилотажное исследование – это и есть осуществление широкомасштабного проекта, только в миниатюрном виде. Оно составляется на основе логического осмысления всей проблемы будущего исследования, приблизительного расположения вопросов с точки зрения их очевидной целесообразности. В ходе пилотажа проверяются все процедуры, весь инструментарий исследования, выбраковываются неудачные вопросы, вносятся коррективы на отдельных этапах исследования.

Конечно, предварительное тестирование требует средств и времени, но оно абсолютно необходимо, потому что без его проведения исследователь рискует получить негодные или вводящие в заблуждение данные. К проведению предварительного тестирования надо относиться как к покупке страховки, без которой вы можете в какой-то момент оказаться перед целой горой очень дорогостоящей, но негодной информации, чего не случится, если вы вовремя обнаружите и откорректируете все возможные недочеты. [c.213]

ПРОВЕДЕНИЕ ОПРОСА

Завершив подготовительную работу, мы можем наконец приступить к собственно опросу. Он является ядром всего исследования, поскольку именно в ходе него происходит непосредственный сбор данных. То, какие процедуры производятся на этом этапе, зависит от типа [c.213] проводимого опроса. В гл.7 мы приведем несколько советов касательно очного и телефонного интервьюирования. Здесь же мы упомянем о важнейших моментах проведения почтового опроса.

Самые серьезные проблемы, связанные с почтовым опросом, – это невозвращение и задержки с возвращением анкет, искажения в ответах и неправильно заполненные анкеты. В среднем для почтового опроса считается вполне допустимым возврат анкет в размере 50% общего числа разосланных, а 70%-ный возврат считается очень хорошим показателем. Однако отсутствие искажений в ответах важнее, чем высокий процент возврата анкет, поскольку задержка с возвращением анкет чревата лишь тем, что выборка будет нерепрезентативной. Существует несколько методов обеспечения большего процента возврата. Они включают в себя следующее.

В почтовом опросе обычно в одном конверте посылаются анкета, сопроводительное письмо, разъясняющее цель опроса, и пустой конверт для отсылки анкеты обратно. Если опрос невелик, анкеты могут непосредственно вручаться респондентам кем-нибудь из персонала опроса, а затем таким же путем забираться у них обратно. В этом случае респонденту труднее забыть по рассеянности об опросе и не заполнить анкету.

Повторное напоминание по почте помогает не только существенно ускорить возврат анкет, но и установить, кто из респондентов почему-либо не получил первого письма. Обыкновенно бывает достаточно трех почтовых отправлений (первого и двух других с напоминаниями). При условии, если возможно легко определить адреса респондентов, уже вернувших анкеты, повторные письма из соображений экономии имеет смысл рассылать только тем, кто анкет не вернул. Если же адреса вернувших анкеты установить затруднительно или не удается вовсе, хорошим решением может явиться рассылка повторных писем всем членам выборки с выражением благодарности в адрес тех, кто ответил, и с напоминанием о необходимости ответить всем остальным. Повторное почтовое отправление должно содержать письмо с просьбой прислать обратно заполненную анкету и дополнительный экземпляр анкеты на тот случай, если первый экземпляр был утерян или не дошел до респондента. [c.214]

Во все почтовые отправления бывает разумно вложить номер телефона, по которому респонденты могут обращаться с вопросами. Это ускоряет процесс возврата анкет и, кроме того, снижает число анкет, заполненных неправильно. Следует также учитывать, что люди, как правило, более склонны отвечать на вопросы анкеты, если она анонимна. Поэтому процент возврата анкет увеличится, если на анкете не будет стоять никаких лишних, непонятных респонденту отметок или цифр (например, ее порядкового номера), которые респондент может воспринять как способ опознания его личности.

Некоторые исследователи предпочитают платить респондентам за возврат анкеты. Процесс получения ответов может ускориться, однако при этом увеличивается риск искажения результатов, ибо те, кого привлекают столь небольшие суммы денег, какие им обычно готов предложить исследователь, вполне могут оказаться нетипичными для данной группы населения в целом и практика денежного вознаграждения может привести к нерепрезентативному переполнению выборки подобными респондентами. Кроме того, оплачивание труда респондентов исключает анонимность опроса, поскольку, прежде чем заплатить, исследователь должен быть в состоянии определить, кто из респондентов вернул анкеты, а кто нет. [c.215]

НАБЛЮДЕНИЕ ЗА ХОДОМ ОПРОСА (МОНИТОРИНГ)

Мониторинг опроса необходим для обеспечения валидности и обобщаемости результатов. С помощью тщательного мониторинга можно выявить случаи чересчур медленного или неравномерного хода опроса и внести в него нужную коррекцию. Во всех типах опроса это предполагает аккуратное сохранение всех заполненных инструментов по мере их поступления.

В случае почтового опроса каждая возвращенная анкета должна быть вскрыта, проверена на предмет правильности ее заполнения и подшита в общий комплект (файл). Каждой анкете должен быть придан серийный номер, так чтобы впоследствии можно было легко установить время ее возврата. Число анкет, поступивших за день, должно отмечаться в особом журнале, чтобы исследователь имел возможность следить за ходом возврата анкет. Если по возвращенной анкете можно установить личность респондента, то исследователю [c.215] следует фиксировать поступление анкет таким образом, чтобы при этом выявлялись возможные диспропорции в ходе их возврата. Если выяснится, что какая-то географическая или демографическая группа респондентов очень пассивно отвечает на анкеты, то может понадобиться лишний раз напомнить им об опросе – иначе выборка может стать нерепрезентативной. Вдобавок к этому просматривание поступающих анкет помогает обнаружить промахи, допущенные респондентом, например пропуск последней страницы инструмента или неверное прочтение инструкции в той ее части, где говорится, как следует отмечать нужные пункты анкеты. Последующий телефонный звонок или уточняющее письмо (в случае неанонимного опроса) может помочь спасти анкету, которую иначе придется признать недействительной.

В случае очного опроса мониторинг производится главным образом посредством выслушивания исследователем устных отчетов интервьюеров, по мере того как они возвращаются с опроса. Исследователь или его опытный ассистент должен проверять заполненные бланки интервью с целью определения: (1) те ли люди (те ли семьи) были опрошены, (2) все ли опросные листы были заполнены и возвращены, (3) указаны ли в путеводителе дата и время проведения интервью, (4) проставлены ли в бланке код интервьюера и опознавательный номер респондента, (5) для всех ли отказов давать интервью изложены соответствующие причины и везде ли, где надо, отмечена договоренность о сроке дополнительного визита к респонденту (если во время первого визита интервьюера респондент почему-либо был недоступен). Все это помогает обеспечить правильность выборки и способствует дальнейшей верификации данных.

Мониторинг телефонного опроса включает в себя периодическую проверку записей интервьюеров по тем же параметрам, что и в случае очного интервьюирования. Кроме того, у исследователя или руководителя полевого обследования зачастую имеется возможность тайно прослушивать выборочные интервью. Эта мера усиливает у интервьюеров чувство ответственности, а также помогает обнаруживать и устранять недочеты, допускаемые ими в ходе применения инструмента.

Тщательный мониторинг способен сыграть значительную роль в обеспечении валидности результатов опроса. [c.216]

КОНТРОЛЬНАЯ ПРОВЕРКА

Контрольная проверка (верификация) особенно важна при очном опросе, когда интервьюер – в случае его недобросовестности – имеет возможность сфальсифицировать результаты интервью, да и добросовестный интервьюер может ошибиться, опросив не того, кого надо. Бывали случаи, что непрофессиональные интервьюеры, чтобы избежать долгих хождений, сочиняли вымышленные интервью, а приходящие няни выдавали себя за хозяев дома и давали за них интервью. Контрольная проверка позволяет исследователю устранить ошибки этого типа и удостовериться в том, что выборка формируется согласно установленной процедуре.

Верификация итогов очного интервью обычно сводится к дополнительной встрече (разговору) с тем или иным респондентом с целью определения: (1) имело ли место интервью на самом деле, (2) все ли вопросы задал интервьюер и все ли ответы он правильно записал. Чтобы это выяснить, спросите респондента, когда имело место интервью и сколько приблизительно оно длилось. Если респондент подтвердит факт проведения интервью, попросите его ответить еще раз на два простых вопроса (взятых из середины и из конца интервью) под тем предлогом, что его первоначальные ответы были записаны неразборчиво. Сверьте новые ответы с теми, которые были зафиксированы ранее.

Поскольку методика построения выборки иногда не позволяет исследователю заранее знать имена или адреса респондентов, то тогда ему имеет смысл воспользоваться обратным телефонным справочником, где телефонные номера перечисляются в порядке их возрастания, который соответствует расположению дома на местности, а не тому или иному порядку расположения фамилий абонентов. Исследователю следует набирать номера тех домов, которые, согласно выборке, должны были попасть под опрос. В подобном случае неправильно было бы звонить просто тем респондентам, фамилии которых указаны в возвращенных анкетах.

Если телефонная связь оказывается неэффективной, то по тем адресам, которые должны были попасть в опрос, могут быть разосланы письма (со вложенными в них открытками с обратным адресом и с упомянутыми выше [c.217] вопросами), обращенные к тому из членов семьи, кто давал интервью, с просьбой заполнить и отослать обратно открытку.

В широкомасштабных опросах верификация осуществляется на выборочной основе, поскольку связываться еще раз со всеми респондентами может оказаться чересчур накладно. Однако если в ходе выборочной проверки в материалах интервьюера обнаруживается хоть одна значительная ошибка или хоть один случай фальсификации, то проверке должны быть подвергнуты и все остальные взятые им (ею) интервью. [c.218]

ВТОРИЧНЫЙ АНАЛИЗ ДАННЫХ ОПРОСА

Остальные этапы опросного исследования рассмотрены в других главах. Здесь мы не будем забегать вперед, но тем не менее нам хотелось бы остановиться на некоторых аспектах анализа данных, не затронутых в других главах.

Надо иметь в виду, что большинство политологов (возможно, даже большая часть политологов, публикующих книги и статьи, основанные на опросных данных) никогда сами не проводят опроса. Происходит это потому, что зачастую очень трудно получить необходимую финансовую поддержку, а также потому, что ответить на тот или иной исследовательский вопрос нередко вполне возможно, используя опросные данные, собранные другими. Изучение данных, собранных кем-то другим, называется вторичным анализом. Ввиду общей дороговизны опросов такой анализ опросных данных весьма обычен¹¹.

Бытует мнение, что вторичный анализ является анализом низшего сорта по сравнению с первичным сбором данных, поскольку он не дает новой информации, пригодной для изучения. Такой подход представляется ошибочным, ибо вторичный анализ иногда бывает в высшей степени желателен в силу целого ряда причин. Прежде всего, результаты почти любого опроса содержат данные, которые первоначальный исследователь нигде не использовал из-за того, что они имеют лишь косвенное отношение к изучаемому им вопросу. А какой-то другой исследователь, возможно, найдет, что эти данные прекрасно подходят для ответа на занимающий его вопрос. Таким образом, вторичный анализ обеспечивает более полное использование данных и способствует экономии средств в ситуации, [c.218] когда уже имеется вполне достаточно нужной информации. Во-вторых, опросы (как и любой другой столь же назойливый, с точки зрения населения, способ сбора информации) несут в себе опасность контаминации населения. Это означает, что многочисленные повторные исследования одного и того же явления среди одной и той же группы населения фактически могут спровоцировать изменения в этом явлении или же вызвать нежелание людей участвовать в дальнейших опросах. Не требуя дополнительных полевых исследований, вторичный анализ сводит на нет возможность подобного рода контаминации. В-третьих, хотя вообще в распоряжении политолога имеется множество методов анализа данных, в рамках одного исследования он будет склонен использовать лишь некоторые из них. А при вторичном анализе исследователь может применить к изучению тех же самых данных другие или новые методы, что, возможно, расширит его понимание предмета или даже приведет к другому ответу на тот же самый, первоначальный исследовательский вопрос.

Самый плодотворный подход при вторичном анализе заключается в том, чтобы сначала выбрать исследовательский вопрос, выработать подлежащие верификации гипотезы, а затем заняться поиском завершенных исследований, в которых имеются данные, необходимые для верификации этих гипотез. Работа в противоположном направлении (т.е. сначала обнаружение некоторого добротного корпуса данных, а затем его изучение в надежде натолкнуться на какой-нибудь важный исследовательский вопрос) хотя в иных случаях и окупается, но зато сильно ограничивает спектр вопросов, доступных взору исследователя.

Первое требование, предъявляемое к корпусу данных, состоит в том, чтобы он был основан на выборке из релевантной для данной задачи группы населения. Например, если мы хотим сделать некоторое обобщение касательно всех женщин США, то изучение выборки из общего числа женщин-избирателей штата Канзас ничего нам не даст. Второе требование касается того, чтобы инструмент опроса содержал релевантные для данной задачи операционализации ключевых переменных, входящих в те гипотезы, которые подлежат верификации. Если, к примеру, в исследовании центральное место занимает проблема различий [c.219] между белыми и неграми, а в первичном корпусе данных расовые различия фиксированы лишь как различия между белыми и небелыми, то изучение этого корпуса в свете данной исследовательской задачи ничего не даст, поскольку в категорию небелых, кроме негров, входят и другие расовые группы (мексиканцы, индейцы и пр.).

Как же выяснить, подходит для нас или нет то или иное исследование? Прежде всего, в хороших исследовательских отчетах описывается операционализация ключевых переменных и указывается, какая выборка была использована в исследовании. Затем, в книгах и журнальных статьях порой можно найти вполне достаточно информации, чтобы судить о пригодности для наших целей приводимого там корпуса данных; поэтому изучение литературы – один из важнейших источников данных для вторичного анализа. Наконец, и некоторые политологи не откажутся поделиться своими данными, если их об этом попросить, поэтому корпус данных иногда можно получить, обратившись непосредственно к автору интересующего нас исследования.

К счастью, есть и более систематический и надежный путь к тому, чтобы обнаружить и получить доступ к данным для вторичного анализа. Существует ряд учреждений, собирающих данные так же, как библиотеки собирают книги. Такие учреждения называются архивами данных. Они занимаются классификацией данных, имеющей целью облегчение их дальнейшего поиска, а также переводят данные в форму, удобную для исследователей, которые не имеют отношения к первичному исследованию, в рамках которого были собраны данные. Затем исследователям за плату предоставляется доступ к хранящейся в архиве информации. Ниже перечислены некоторые из наиболее важных архивов социологических данных в США:

Бюро прикладных социологических исследований, Колумбийский университет, Нью-Йорк (Bureau of Applied Social Research, Columbia University, New York), – собрание данных опросов общего характера, проводившихся в США;

Библиотека международных социологических данных и справочная служба. Опросный научно-исследовательский центр, Калифорнийский университет, Беркли (International Data Library and Reference Service, Survey Research Center, University of California, Berkeley), – большое собрание результатов опросов, проводившихся за пределами США, в основном [c.220] в Азии и Латинской Америке; Межуниверситетский консорциум политических и социологических исследований, Мичиганский университет, Анн-Арбор (Inter-University Consortium for Political and Social Research, University of Michigan, Ann Arbor), – очень большое собрание данных опросов, проводившихся в США и за их пределами; особое внимание уделяется политологическим переменным, имеются корпуса сравнительных данных по разным странам и обширный корпус данных по политическому поведению в США;

Центр политологических данных Льюиса Хэрриса, Университет Северной Каролины, Чэпел-Хилл (Louis Harris Political Data Center, University of North Carolina, Chapel Hill), – собрание результатов опросов, проводившихся в США Агентством Льюиса Хэрриса по изучению общественного мнения (Louis Harris Public Opinion Polling Agency);

Центр по обследованию общественного мнения в США, Чикагский университет, Чикаго (National Opinion Research Center, University of Chicago, Chicago), – собрание результатов опросов, проводившихся данным центром в США, содержит подразделы по ряду социальных проблем; Центр но изучению общественного мнения Роупера, Уильямс-колледж, Уильямстаун, Массачусетс (Roper Public Opinion Research Center, Williams College, Williamstown, Massachusetts), – самый большой в США архив социологических данных, содержащий результаты опросов в разных странах и по широкому кругу проблем;

Библиотечная служба социологических данных и программ, Висконсинский университет, Мэдисон (Social Science Data and Program library Service, University of Wisconsin, Madison), – собрание, содержащее главным образом данные по социально-экономическим условиям жизни в США, а также специальный файл данных с характеристиками американских городов.

Каждое из этих учреждений публикует списки и общее описание имеющихся и поступающих в его распоряжение опросных данных. Если мы обнаруживаем в таких списках предположительно интересующее нас исследование, то определить его реальную пользу для нас можно по книге кодов. В ней указываются все вопросы, задававшиеся в ходе опроса, и объясняется способ кодирования ответов, что может позволить нам оценить степень соответствия операционализации [c.221] данного исследования нашим гипотезам. После этого за плату мы можем получить из архива нужные данные.

ВЫВОДЫ

Опрос представляет собой в высшей степени гибкий метод сбора данных, поскольку он может быть легко приспособлен к получению данных по очень широкому кругу вопросов. Однако для того, чтобы в полной мере осознать потенциал опроса, необходимо ближе познакомиться с процессом интервьюирования, составляющего во многом стержень всего опроса, а также с возможностями возникновения данных, обеспечиваемыми техникой шкалирования. Этим вопросам посвящены гл. 7 и 8. [c.222]

7-лекция. ИНТЕРВЬЮИРОВАНИЕ

Очное интервью является одновременно одним из худших и одним из лучших методов сбора информации, доступных ученому-политологу. Наиболее существенный его недостаток связан с тем, что сама ситуация интервьюирования слишком богата возможностями для такой ответной реакции (реактивности) респондента, которая может оказать нежелательное воздействие на результаты обследования. Реакция респондента на внешний облик или стиль поведения интервьюера, на формулировки вопросов, на обстановку, в которой проводится интервью, может породить информационные “помехи”, имеющие отношение не столько к реальному миру, сколько к самому процессу опроса.

Не рассчитывайте, что вам удастся взять под контроль все факторы, влияющие на этот процесс. Бывали случаи, например, когда интервью фактически расстраивалось из-за того, что интервьюер чем-то напоминал респонденту его мать и вызывал тем самым чисто эмоциональную реакцию, или же из-за того, что ранее опрошенный респондент, делясь впечатлениями об опросе со своими соседями, “натаскал” их в отношении ответов. Однако исследователь может предпринять определенные шаги, с тем чтобы свести к минимуму ожидаемые проявления реактивности и увеличить надежность опроса. Об этом мы немного расскажем в этой главе. Нас будет интересовать динамика ведения опроса как при выборочном обследовании, когда респонденты рассматриваются только как представители какой-то генеральной совокупности, так и при так называемом направленном и специализированном интервьюировании, когда респонденты отбираются по какому-то определенному признаку. Эти два типа интервьюирования требуют от исследователя различных навыков и различных методик. В данной главе предлагаются рекомендации по всем этим проблемам. Эти рекомендации, однако, не могут заменить исследователю [c.224] практического опыта, ибо ведение опроса, как и многое другое в социальных науках, является искусством в не меньшей степени, чем наукой. [c.225]

ВЫБОРОЧНОЕ ИНТЕРВЬЮИРОВАНИЕ

Если вы студент-политолог, то вам может понадобиться провести интервьюирование для курсовой работы либо вам могут предложить поработать в качестве интервьюера в рамках одного из проектов, разрабатываемых вашим научным руководителем. Если вы ученый-политолог, то вам, возможно, придется руководить опросом как составной частью научного поиска в рамках ваших профессиональных интересов либо вас могут попросить дать опенку методике опроса, проводимого другим исследователем. В каждом из этих случаев вам понадобится понимание динамики опроса и знакомство с пригодными для него методиками. Хотя методы и техника опроса, эффективные при любом опросе, могут слегка варьироваться в зависимости от типа исследования и от характеров респондентов, мы тем не менее можем предложить некоторые общие правила интервьюирования, применимые в большинстве случаев.

Если можно заранее установить круг респондентов, то в этом случае неплохо будет для начала послать будущим респондентам почтовые открытки с уведомлением о предстоящем визите интервьюера “в связи с проведением важного научного исследования”. Такой прием породит у респондента доверие и увеличит вероятность того, что он согласится дать интервью.

В дополнение к этому исследователь перед началом опроса должен удостовериться в том, что: (а) каждый интервьюер снабжен стандартным текстом “вступительного слова”, которое позволит в простой форме объяснить респонденту суть обследования и сразу же приступить к опросу; (б) каждый интервьюер имеет при себе рекомендательное письмо и документы, а также номер телефона, по которому респондент при желании может проверить личность интервьюера и цель его визита; (в) местная полиция уведомлена о проведении обследования и знает, как отвечать на возможные телефонные звонки по поводу него.

По ходу интервью интервьюеру следует придерживаться следующих правил: [c.225]

1. Время начала и время окончания каждого интервью обязательно фиксируется в бланке интервью.

2. Все заполненные бланки интервью должны быть подписаны интервьюером, либо на них должен быть проставлен код интервьюера, если таковой ему придан.

3. Чтобы установилась атмосфера доверия, надо стараться смотреть в глаза респонденту.

4. Чтобы не снижать темп интервью, ответ на вопрос следует по возможности фиксировать в тот момент, когда задается следующий вопрос.

5. Фиксировать ответы следует как можно более незаметно для респондента.

6. Интервьюеру следует самому читать и фиксировать все ответы. Нельзя разрешать заполнять опросный лист самому респонденту, как это бывает при анкетировании.

7. Если нужно зафиксировать комментарий к ответу, то следует записывать его не в виде резюме, а точно в тех словах, какими пользуется респондент.

8. Если респондент отвечает расплывчато, то надо добиться от него более четкого ответа.

9. Если респондент предваряет ответ словами типа “Нет, но...”, то подобные оценочные замечания следует фиксировать так же, как и сам ответ.

10. Если для получения адекватного ответа требуется предварительно прощупать почву, то интервьюеру следует пометить это себе в бланке и записать те вопросы, которые могут ему в этом помочь (например: “А почему бывает так, что...?”). В хорошо разработанных интервью соответствующие “пробные шары” указываются в бланке для каждого вопроса, при котором они могут понадобиться.

11. Никогда не надо пытаться интервьюировать одновременно более одного человека.

12. Интервью надо стараться проводить в обстановке с глазу на глаз с респондентом. Если кто-то еще будет настаивать на своем присутствии, то надо поставить условие, чтобы в ход интервью не было вмешательства. Не следует вносить изменения в ответы респондента в том случае, если кто-то другой убедит его переменить свое первоначальное мнение.

13. Интервьюеру не следует позволять респонденту втягивать себя в обсуждение предмета обследования, ибо [c.226] замечания интервьюера могут повлиять на ответы респондента.

14. Если формулировка вопроса или предлагаемого варианта ответа вызывает у респондента возражения, то интервьюеру следует не просто настаивать на ней, а объяснить, что он должен задавать вопросы в том виде, как они записаны, и что не он ответствен за формулировки.

15. Возражения респондента на вопрос следует отмечать на полях бланка интервью, поскольку позже они могут пригодиться.

16. Следует фиксировать только первоначальные ответы. Не надо менять зафиксированный ответ, если респондент попросит об этом, после того как услышит следующий вопрос.

17. Когда респондент отвечает “Я не знаю...”, не нужно торопиться задавать ему сразу следующий вопрос, потому что эта фраза иногда бывает вводной для ответа по существу (“Ну, я не знаю... мне кажется, что...”).

18. Никогда не надо преднамеренно менять формулировку или порядок вопросов.

19. Никогда не надо сообщать респонденту (даже если он просит об этом) того, что ответили на данный вопрос другие респонденты.

20. Никогда не надо пытаться опрашивать по памяти. Бланк интервью должен быть у интервьюера всегда перед глазами, и к нему следует обращаться даже тогда, когда интервьюеру достаточно одного взгляда на лист, чтобы вспомнить вопрос.

21. По окончании интервью, прежде чем отпустить респондента, нужно еще раз проглядеть весь бланк, чтобы убедиться, что были заданы все вопросы и зафиксированы все ответы. Уж лучше задать пропущенный вопрос вне общей последовательности или попросить респондента повторить ответ, чем оставить пустое место в бланке интервью без особой на то причины. [c.227]

ФОРМУЛИРОВАНИЕ ВОПРОСОВ

Исследователь может значительно упростить работу интервьюера, если снабдит его четкими инструкциями и тщательно сформулирует все вопросы. Правильно заданный вопрос может зачастую избавить интервьюера от лишних проблем. Например, интервьюеру гораздо легче [c.227] установить контакт с респондентом и избежать “допроса с пристрастием”, если вопросы сформулированы так, что респонденту не приходится то и дело признаваться в своем незнании того или иного факта или в отсутствии каких-либо соображений по данному предмету. Потенциальную напряженность могут в значительной степени снимать фразы типа “Ну, Вам, наверно, уже доводилось об этом читать”, следующие в конце вопроса.

Дать совершенно точные указания относительно того, какие формулировки корректны, а какие нет, невозможно, так как вопросы, подлежащие формулировке, всякий раз обусловлены конкретным предметом исследования. Можно, однако, указать на некоторые типичные формулировочные ошибки, которых следует избегать. Если вопрос не содержит ни одной из этих ошибок, то вполне вероятно, что он сформулирован корректно. Итак, какими не должны быть вопросы:

1. Чрезмерная длина. Если и существует какое-то общее правило формулирования вопросов, то оно состоит в том, чтобы использовать кратчайшие формы вопроса, в коммуникативном отношении наиболее эффективные. Длинные вопросы не только отнимают больше времени, но также куда скорее могут сбить с толку респондента или проскочить у него мимо ушей. Кроме того, длинный вопрос скорее будет содержать в себе и другие ошибки из числа упоминаемых ниже. Никогда не пользуйтесь двумя словами там, где довольно одного. Избегайте условных придаточных и лишних эпитетов. Например, вопрос “Если бы президентские выборы проходили в настоящее время, а не в ноябре, то, как Вы думаете, за кого из следующих кандидатов вы бы проголосовали?” полезно было бы укоротить до “Если бы президентские выборы проходили сегодня, за кого бы Вы голосовали?” (далее приводится список кандидатов).

2. Неопределенность. Стремление к краткости не должно приводить к неполным или неточным формулировкам. Чтобы убедиться, что вопрос содержит всю информацию, необходимую для получения толкового ответа, спросите себя, не захочется ли респонденту ответить на вопрос вопросом. Так, на вопрос “Вы когда-нибудь жалуетесь на государственные учреждения?” респондент может ответить: “Жалуюсь кому? Государственным чиновникам? [c.228] Соседям?” Вопросы бывают неоднозначными, когда они чересчур общи (“Не кажется ли Вам, что люди слишком много думают о политике?”) или неопределенны в отношении места, времени или основания для сравнения (“Вы голосовали на последних выборах?”, “Здесь живет много выходцев из Азии?”, “Как по-Вашему, Смит – лучший из кандидатов?”).

3.Двойной смысл. Особо опасная форма неопределенности таится в двойном вопросе. На такой вопрос зачастую невозможно дать цельный ответ, потому что он содержит в себе два самостоятельных вопроса. Например, на вопрос “Как Вам кажется, не тратим ли мы слишком много средств на военную сферу, или же, по-Вашему, важно иметь сильные вооруженные силы?” нельзя ответить ни “да”, ни “нет”, если считать, что иметь сильные вооруженные силы важно, но что текущие расходы на эти цели превышают пределы необходимого. Чтобы избежать таких вопросов, проверьте, не соединяет ли в себе вопрос с союзами “и” или “или” двух вопросов, каждый из которых следует задать отдельно.

4. Тенденциозность. Вопрос может быть сформулирован так, что один ответ на него как бы поощряется в ущерб другому. Такие вопросы обычно называют внушающими. Если респондента спросить “Вы против перевозки школьников автобусами через весь город только ради достижения расового равновесия в шкалах?”, то он будет скорее склонен согласиться, чем в случае вопроса: “Как Вы относитесь к перевозке детей автобусами через весь город для достижения расового равновесия в шкалах?” Фразы, апеллирующие к общественным нормам (такие, как “Как часто Вы выполняете свой гражданский долг, голосуя?”), с очевидностью вносят в ответ искажение. Фразы, предполагающие определенное отношение к какому-либо государственному или общественному деятелю или организации, также могут исказить результат. Например, вопросы, начинающиеся с “Вы согласны с Верховным судом в том, что...?” или “Вы разделяете мнение коммунистов о там, что...?”, по всей вероятности, спровоцируют искаженные ответы.

Если по проблеме существуют противоположные точки зрения, то важно сформулировать вопрос так, чтобы каждая из этих точек зрения выглядела вполне правомерной. Целесообразно формулировать вопрос, к примеру, следующим [c.229] образом: “Некоторые люди, с которыми мы беседовали, считают, что федеральное правительство должно взять нефтяные компании под свой контроль и обращаться с ними как с государственными предприятиями. Другие думают, что это было бы серьезной ошибкой. А как Вы считаете? Как по-Вашему, следует ли федеральному правительству взять под свой контроль нефтяные компании США?” Чтобы избежать тенденциозности, очень важно соблюдать нейтральность в подборе слов.

5. Отрицательные утверждения. Опыт проведения опросов показал, что вопросы типа “Вы считаете, Соединенные Штаты не должны платить репарации Вьетнаму?” респонденты обычно воспринимают в утвердительном смысле и дают ответы, не отражающие их истинного мнения.

6. Убедительность. Несмотря на то что вопрос иногда бывает необходимо предварить пояснением, отстаивать в нем определенную точку зрения является ошибкой. Например, некорректно спрашивать: “Поскольку с эксплуатацией АЭС и захоронением их отходов связано так много опасностей и поскольку мировые запасы урана, необходимого для АЭС, в любом случае будут исчерпаны примерно через 30 лет, некоторые считают, что неразумно вкладывать столько средств в развитие атомной энергетики, в то время как мы могли бы направить их на развитие безопасных и неисчерпаемых видов энергетики, таких, как солнечная, ветряная, метановая. Вы согласны, что наше государство должно резко сократить капиталовложения в атомную энергетику?” Помимо того что это слишком длинный вопрос, несущий в себе риск оказаться непонятым респондентом, он также, по всей видимости, вызовет искажение в ответе, ввиду того, что в нем опущена альтернативная позиция по затронутой проблеме.

7. Высокопарность слога. Незнакомые респонденту термины делают вопрос бесполезным в плане получения нужной информации. Вопросы типа “Как Вы думаете, большинство политиков эгоцентричны?” или “Вы одобряете судебный активизм Верховного суда?” для среднестатистического респондента звучат бессмысленно. Вопрос типа “Многие выдающиеся авторитеты считают, что распространяющиеся повсюду недуги, вызванные к жизни динамикой современной городской культуры, представляют [c.230] собой неотложную проблему, понуждающую к немедленным оздоровительным действиям в виде комплексной федеральной городской политики. Считаете, ли Вы, что подобная государственная городская политика желательна?”, даже если и будет понят, может послужить причиной отчуждения респондента, выставив перед ним интервьюера в роли сноба.

8. Жаргонный стиль. Стремясь к неформальности формулировок, порой можно и переусердствовать. При использовании жаргонных словечек (например, “Не кажется ли Вам, что федеральщики запичкали средствами большие города?” вместо “Не кажется ли Вам, что федеральное правительство расходует слишком много средств на программы урбанизации!”) исследователь рискует сразу в нескольких отношениях. Во-первых, опрос может показаться респонденту непрофессиональным, во-вторых, использование жаргона может покоробить тех из респондентов, кто вообще не переносит жаргона, либо тех, кто рассматривает жаргон как принадлежность сугубо “своей” субкультуры. Кроме того, если респондент и интервьюер придают жаргонному термину разные значения, это может помешать их взаимопониманию. Лучше всего совсем не использовать жаргона.

9. Поощрение стандартных ответов. Особые сложности при формулировании возникают тогда, когда нужно задать вопрос на какую-либо деликатную тему. Большинство людей не склонны говорить с посторонними о своих доходах, семейной жизни, сексуальном поведении, а в иных случаях даже о своих политических предпочтениях. Скованность респондента можно частично преодолеть с помощью корректной формулировки вопросов. Например, возьмем тот тип вопросов, на которые в обществе принято отвечать вполне определенным образом. Если такой вопрос недостаточно тщательно сформулирован, респондент будет стремиться дать ответ, приемлемый с точки зрения общественной морали, вне зависимости от своего собственного мнения. Таковы вопросы, связанные с расовыми предрассудками. Поскольку расизм в американском обществе в целом осуждается, люди, как правило, не склонны открыто высказывать свои расистские взгляды.

Мы можем предложить три тактических приема, рассчитанных на стимулирование искренних ответов в [c.231] противовес социально обусловленным. Первый из них заключается в том, чтобы указать респонденту на широкую распространенность или правомерность осуждаемых в обществе взглядов. Например, спросите его: “Многие полагают, что в округе, где начинают селиться негры, уровень жизни начинает постепенно падать. Другие же не считают, что присутствие негров что-либо существенно меняет в жизни округа. Согласны ли Вы с тем, что чернокожие жители, как правило, служат причиной ухудшения жизни в округе?” Другой прием состоит в том, чтобы заключить в вопрос презумпцию того, что респондент совершает социально осуждаемые поступки или придерживается непопулярных взглядов; таким образом, если это не так, респондент будет вынужден это отрицать. В то же время такой вопрос облегчает респонденту “признание” в социально осуждаемых взглядах в том случае, если он их придерживается. Например, вопрос “Какой урон, по-Вашему, будет нанесен этому району, если в нем станут селиться негры?” облегчает проявление расового предубеждения в отличие от более нейтральной формулировки: “Как Вы думаете, повредит ли этому району, если в нем станут селиться негры?”

И наконец, если вы просите человека высказать, возможно, негативное мнение о других лицах, организациях или о чем-либо еще, то полезно бывает предоставить ему также возможность выразить и похвалу. Это дает респонденту ощущение собственной справедливости и беспристрастности. Старайтесь перемежать вопросы, на которые ожидаются негативные или критические ответы, такими, которые предполагают более позитивную реакцию.

10. “Вымучивание” ответа. Многие люди думают, что не иметь мнения по политическим вопросам с общественной точки зрения предосудительно, и потому зачастую высказывают свое мнение о том, о чем никогда раньше не задумывались. Это может приводить к искажению результатов обследования. Чтобы избежать этого, целесообразно среди возможных ответов предусмотреть формулировку “не имею определенного мнения” или составлять вопросы так, чтобы отсутствие мнения выглядело вполне допустимым. Например, попробуйте начать вопрос так: “Некоторые люди видят в [c.232] атомной энергетике важную политическую проблему; другие не столь сильно этим озабочены. А каково Ваше мнение по этому поводу?” [c.233]

ОТБОР ИНТЕРВЬЮЕРОВ

Профессиональные политологи не только сами проводят опросы, но и бывают часто вынуждены привлекать других лиц к проведению опроса. Инструктируя опрашивающих, до них необходимо донести те сведения о методах интервьюирования, которые будут изложены ниже. Однако первый шаг в подготовке бригады интервьюеров заключается в отборе подходящих людей.

Поскольку респонденты реагируют не только на вопросы, но и на людей, которые задают им эти вопросы, и на то, как они это делают, постольку решающим фактором успеха могут на деле оказаться такие качества опрашивающего, которые, казалось бы, не имеют отношения к опросу. Опыт опросов в США позволяет выдвинуть следующие основные принципы отбора и подготовки интервьюеров, направленные прежде всего на то, чтобы свести к минимуму нежелательные последствия реактивности.

1. Опрашивающий должен держаться скромно и не вызвать у респондента никаких опасений. Например, те организации, которые специализируются на опросах, в качестве интервьюеров используют чаще всего женщин среднего возраста, поскольку выяснилось, что они менее всего способны внушить страх или подозрения. По этой же причине опрашивающий должен быть иногда в чем-то сходен с респондентом. Оказалось, к примеру, что при изучении расовых отношений чернокожие опрашивающие получают от чернокожих и от белых респондентов ответы, как правило отличающиеся от ответов, получаемых белыми опрашивающими¹. Кроме того, интервьюер должен быть одет как можно более скромно для той среды, в которой проводится опрос, – но, само собой разумеется, опрятно. Внешний облик опрашивающего должен как можно меньше говорить о его личных пристрастиях или социальной принадлежности.

2. При опросе интервьюеру следует вести себя беспристрастно, открыто и доброжелательно. Под беспристрастностью мы подразумеваем, что задавать вопросы и фиксировать [c.233] ответы надо автоматически, т.е. ничем не выказывая своего одобрения или неодобрения ответам респондента и не подталкивая его к тому или иному ответу. Вопросы следует задавать слово в слово так, как они сформулированы. Если респондент не понял вопроса, то хороший интервьюер не будет пояснять вопрос, а просто повторит его. Вести себя открыто – значит прежде всего вести себя так, чтобы не вызывать у респондента излишней недоверчивости или враждебной реакции. Задавать вопрос нужно отстранение) и раскованно, как если бы не было абсолютно никаких оснований ожидать, что респондент откажется отвечать. По стилю хороший опрос должен приближаться к дружеской, но содержательной беседе.

Интервьюер должен освоиться с вопросами настолько, чтобы не было заметно, что он их читает, а в запасе у него должны быть заготовлены ответы на те вопросы, которые могут возникнуть у респондента, – такая практика позволяет сократить время на возможные заминки в ходе опроса².

Доброжелательным интервьюер выглядит в том случае, если он обращается к респонденту уважительно и с симпатией. Очень важно избегать стиля “допроса с пристрастием”; надо стараться всем своим видом показывать, что вы признаете правомерность любого ответа, данного респондентом.

3. В идеале интервьюер должен быть совершенно честен, надежен и скрупулезен в работе, ровен и спокоен в личном общении. Среди предполагаемых интервьюеров важно искать людей именно с такими чертами характера. Однако бывает, что даже наиболее подходящие и подготовленные опрашивающие не в состоянии получить нужную исследователю информацию. В таких случаях исследователь вынужден проводить опрос самостоятельно и с использованием особых методик. Примером ситуации подобного рода может служить прежде всего исследование, требующее направленного интервьюирования.

Эти качества важно учитывать и в работе над будущими интервью. Существуют случаи, однако, когда даже наиболее подходящий и прекрасно обученный интервьюер не может собрать информацию, необходимую исследователю. Тогда ему необходимо самому руководить опросом и использовать особые методы. [c.234]

НАПРАВЛЕННОЕ ИНТЕРВЬЮИРОВАНИЕ

В политологии существует много важных исследовательских вопросов, на которые можно дать ответ, только выяснив, как думают и поступают в соответствующих ситуациях вполне определенные люди или тип людей. Например, хотя мы всегда вправе строить любые предположения относительно причин принятия того или иного законопроекта, но действительные мотивы мы можем узнать, только выяснив мнение законодателей. Для ответа на подобные вопросы обычно проводится не массовое обследование населения, а направленное интервьюирование особых групп – элит. В данном контексте это люди, которые располагают такими сведениями, важными для целей данного исследовательского проекта, которые предполагают индивидуальный подход при интервьюировании. Элитный статус этим людям придает не их роль в обществе, но их доступ к информации, которая может помочь ответить на определенный исследовательский вопрос (хотя, конечно, те, кто удостаивается такого подхода при обследовании, зачастую являются реально важными фигурами в политике, общественной жизни или экономике).

Основное различие между выборочным и направленным интервьюированием лежит в степени стандартизации процедуры опроса. Выборочное обследование предполагает как можно более одинаковый подход ко всем респондентам. Дело в том, что целью подобного опроса является получение такой информации, которая может быть использована для количественного сравнения ответов респондентов, что позволит далее обобщить результаты для генеральной совокупности. При направленном опросе каждый респондент требует особого подхода в той мере, в какой это предполагает та уникальная информация, которой только он (она) и располагает. Целью такого опроса является не сбор заранее специфицированных данных, а получение такой информации, которая поможет реконструировать некоторое событие или же обнаружить закономерность в особом типе поведения.

Второе крупное различие между направленным и выборочным интервьюированием заключается в том, что, в то время как выборочное интервьюирование – обычно плановое интервьюирование с заранее определенным планом [c.235] опроса, при направленном интервьюировании плана чаще всего нет. Жесткий план интервью предполагает, что вопросы и порядок их предъявления респонденту заранее определены и не могут меняться. При полностью бесплановом интервью опрашивающий руководствуется только общей постановкой задачи (например, выяснить, каким образом было принято конкретное решение данным государственным учреждением) и не имеет заранее заготовленного списка вопросов. Интервью с жестким планом обладают тем преимуществом, что они приводят к сильно стандартизованным результатам, поскольку в них требуется, чтобы все респонденты отвечали на одни и те же вопросы, выбирая ответы из одного и того же набора возможностей. Это позволяет сравнивать ответы разных респондентов и облегчает дальнейшую обработку данных. Однако тщательное планирование интервью имеет свои недостатки: оно ограничивает получаемую информацию теми данными, которые, по заранее сформировавшемуся у исследователя мнению, необходимы для понимания изучаемого явления. Планирование ограничивает возможности исследователя в расширении теоретического горизонта, а также в выяснении того, что именно респонденты считают важным или значимым.

Бесплановые интервью, напротив, приводят к результатам, которые с трудом поддаются сопоставлению, сжатому изложению и подытоживанию. Однако в “активе” у таких интервью – возможность получения от респондента незапланированной (и неожиданной) информации, которая может совершенно изменить взгляд на изучаемые явления. Бесплановая методика особенно хорошо подходит для интервьюирования специфических групп, потому что при таком опросе исследователя интересует прежде всего та информация, которую сам респондент считает важной и релевантной для данного предмета исследования, и именно суждения самого респондента наталкивают исследователя на те вопросы, которые следует задать для получения нужной информации. Выявление фактов и закономерностей при этом для опрашивающего важнее, чем измерение предварительно отобранных явлений.

Направленное интервьюирование способно предоставить исследователю информацию, которая наиболее существенна для понимания определенного политического [c.236] события и которую иным путем не добыть. При всем том направленное интервьюирование в научном отношении сопряжено с весьма реальным риском. Ведь оно обычно подразумевает, что свое представление о некоем политическом процессе исследователь формирует на основании мнения тех людей, которые непосредственно вовлечены в этот процесс. Надежность информации, полученной таким путем, оказывается при этом под вопросом в том случае, если респондент: (1) имеет такой узкий взгляд на рассматриваемые события, что не в состоянии оценить, что важно, а что нет в их объяснении; (2) располагает неточной информацией (оттого ли, что он чего-то недопонял в событии, или же оттого, что он забыл какие-то важные детали); (3) пытаясь придать рациональный смысл своим собственным действиям, убедил самого себя, что все обстоит именно так, как он говорит, тогда как на самом деле все обстоит несколько иначе; (4) намеренно лжет, чтобы защитить самих себя или других. Например, интервью с высокопоставленными чиновниками администрации президента Рейгана о событиях вроде антииранской аферы может оказаться примером исходящей от каждого из дающих интервью ненадежной информации.

Хотя жесткий контроль над ответами респондента вряд ли вообще возможен, тем не менее существуют некоторые общие правила, следуя которым при направленном интервьюировании можно уберечься от несостоятельных выводов. Во-первых, никогда не придавайте тому, что говорит интервьюируемый, значения факта; скорее этого заслуживает сам факт того, что он это сказал. Ведь для понимания политического поведения знать, во что люди верят или что они считают правдой, зачастую столь же важно, сколь и знать, что на самом деле является правдой. Например, если вам надо выяснить, почему жители некоторого района требуют закрытия близлежащей атомной электростанции, то для вас будет полезно узнать не столько то, какова в действительности надежность аварийной защиты станции, сколько то, что сами жители думают о степени этой надежности.

Во-вторых, никогда не полагайтесь на сведения, исходящие только от одного респондента. Перед тем как сделать заключение, старайтесь получить информацию о каждом событии от возможно большего числа респондентов. [c.237]

Третье, изыскивайте все возможные способы проверки информации, полученной из элитного опроса, сравнивайте ее со сведениями из других источников. Если мы интервьюируем лидеров некой партии, чтобы узнать, почему представитель, поддержанный ею, получил достаточное число голосов на выборах, и отвечающие предлагают в качестве причины “очевидную общественную поддержку кандидата”, то, как следствие, мы должны задаться целью провести опрос общественного мнения, который с очевидностью покажет уровень этой “общественной поддержки”, реально оказанной тому или иному претенденту.

В-четвертых, изучите сам предмет настолько, чтобы уметь опознавать некорректные суждения о нем и выявлять в ответах возможные источники искажения информации. Перед тем как приступать к направленному интервьюированию, следует научиться отвечать для себя на вопросы, подобные следующим: Есть ли основания полагать, что респонденту захочется поверить в то, что не является правдой, или же заставить других в это поверить? Связаны ли с рассматриваемыми событиями какие-либо материальные или политические интересы респондента? Какие из ответов можно признать правдоподобными, если учесть то, что мы знаем о предмете из других, более надежных источников?

Наконец, следует быть всегда начеку в отношении того специфического лексикона, который может использовать интервьюируемый, поскольку разного рода “словечки” могут изменять кажущееся очевидным значение высказываний. Например, в разведслужбах принято вместо слова убить (kill) применять термин разобраться с особой предвзятостью (terminate with extreme prejudice), а для некоторых американских политиков выражение качественное обучение (quality education) – это всего лишь суррогат выражения сегрегация в обучении (racially segregated education).

Опасность того, что результаты направленного интервьюирования окажутся ненадежными, столь велика, что Льюис Декстер, ведущий авторитет в этой области, писал: “Планировать или загодя финансировать целый проект, рассчитывая главным образом на данные интервью, можно, лишь будучи уверенным в том, что интервьюеры достаточно подготовлены, чтобы толково провести опросные беседы, или же если есть надежда, что за респондентом [c.238] удастся каким-то образом понаблюдать, чтобы определить, о чем есть смысл задавать ему вопросы, а о чем нет... План любого обследования, опирающегося на данные направленного интервьюирования, должен включать в себя “аварийный” подплан, предусматривающий применение какой-то заместительной методики... на тот случай, если данные направленного интервьюирования окажутся в целом неинформативными”³.

Несмотря на эти недостатки, в том, что касается освещения важных политических явлений, направленное интервьюирование располагает огромным потенциалом и может служить как ценным дополнением для тех исследований, которые опираются на иные методы сбора информации, так и единственным основанием для важных выводов. Необходимо помнить, что информация, исходящая от людей, которые знают предмет изнутри, не может заменить трезвого теоретического осмысления этого предмета. Чтобы прийти к научно значимым выводам, политолог должен постоянно заниматься наложением своих аналитических категорий и концептуальных схем на собранные при опросе данные. [c.239]

МЕТОДИКА НАПРАВЛЕННОГО ИНТЕРВЬЮИРОВАНИЯ

Один из первых вопросов, с которыми сталкивается исследователь, – это вопрос о том, кого следует опрашивать. При выборочном опросе, когда все респонденты предположительно в равной степени способны дать нужную для исследования информацию, применимы выборочные методы, помогающие определить, кого надо опрашивать. При направленном же опросе надо исходить из того, что потенциальных респондентов отличает друг от друга именно то, насколько они могут быть полезны для исследования и насколько уникальна та информация, которой каждый из них располагает. Зачастую при предварительном обследовании выясняется, что относящейся к делу информацией может располагать целая группа населения. Так, если мы изучаем деятельность какой-либо президентской комиссии, то краткого анализа будет достаточно, чтобы указать на членов комиссии, ее секретариат и экспертов как на искомых респондентов. Если же, однако, мы занимаемся изучением “структуры власти” с целью определить, кто держит бразды правления в [c.239] городе N, то нам не удастся найти какого-либо официального списка людей, оказывающих влияние на политическую жизнь в N. Кого следует интервьюировать в данном случае, опрашивающий должен решить самостоятельно.

Когда потенциальные респонденты отобраны, встает вопрос о том, в каком порядке их интервьюировать. Обычно возникает искушение первыми опросить тех, кто наиболее расположен говорить и наиболее симпатичен, либо тех, кто предположительно обладает самой полной информацией. Однако здесь надо иметь в виду две вещи. Во-первых, дело в том, что любое направленное интервью содержит в себе элемент научного открытия. Редко бывает так, чтобы мы с самого начала ясно представляли себе все, о чем следует спросить. На начальном этапе интервью мы, вполне возможно, узнаем такие факты, которые помогут нам извлечь максимально полезную информацию из дальнейшего опроса. Поэтому интервьюирование наиболее предпочтительных для интересующего нас события фигур зачастую лучше отнести на конец. Во-вторых, при направленном интервьюировании мы обычно имеем дело с лицами гораздо более заинтересованными, чем при выборочном опросе. От каждого респондента мы вправе ожидать совершенно особого (возможно, не лишенного личного интереса) взгляда на изучаемое нами явление, и каждый из них может умышленно или неумышленно дезориентировать нас относительно того, кто знает об этом явлении больше других и кого, соответственно, следует опросить. Ни при каких обстоятельствах нельзя допускать, чтобы выбор респондентов или порядок опроса целиком определялся предложениями респондентов, опрошенных вначале, однако частично учитывать эти предложения вполне допустимо. Уже одно то, что ранее опрошенный предложил опросить кого-то еще, само по себе подчас говорит о наличии каких-то альянсов или других типов коммуникативного взаимодействия. Кроме того, поскольку велика вероятность того, что респонденты знакомы друг с другом и как-то связаны с изучаемым нами предметом, очень важно проследить за тем, чтобы первые этапы опроса не навредили дальнейшему обследованию – в силу невольного отождествления его со вполне определенной группой людей среди потенциальных респондентов. По возможности следует избегать опрашивать [c.240] первыми диссидентов, лидеров оппозиции, экстремистов либо лидеров любой доминирующей коалиции, поскольку слух об этом может дойти до других респондентов и заранее насторожить их или настроить враждебно по отношению к опросу.

Ввиду вышеизложенного первыми лучше всего опрашивать, по-видимому, тех людей, которые занимают стороннюю позицию по отношению к рассматриваемому явлению и мнение которых другие респонденты, имеющие более непосредственное отношение к этому явлению, считают нейтральным. Например, при изучении структуры законодательной власти в том или ином штате вначале лучше опросить рядовых членов законодательного собрания (основной рабочий орган, в котором принимают участие все, кто имеет отношение к законодательной деятельности) и лишь потом – ключевых действующих лиц в законодательстве. Разумно будет также объяснить первым респондентам, что опрос носит предварительный, поисковый характер и что, возможно, вы захотите вернуться к нему после – когда уточните все вопросы и уясните, как интерпретировать ответы на них.

На деле проведение направленного опроса может оказаться весьма трудоемким занятием, поскольку элитные респонденты – это зачастую занятые люди, а опрос каждого из них, как правило, отнимает немало времени (в среднем час и более). При организации интервью могут быть полезны следующие рекомендации (хотя в отдельных случаях может оказаться нежелательно или невозможно им следовать):

1. О времени опроса договаривайтесь обязательно заранее (по телефону или по почте), не появляйтесь внезапно, как это бывает при выборочном опросе.

2. Договариваться об интервью постарайтесь с самим предполагаемым респондентом, а не с его секретарем или помощником.

3. Избегайте подробно объяснять цель интервью, поскольку это может вызвать у вашего будущего респондента искушение отослать вас к одному из своих сотрудников-экспертов.

4. Всегда старайтесь выявить причину отказа и по возможности ее устранить. Например, если проблема в нехватке времени, предложите провести интервью во внерабочее [c.241] время; если проблема в дефиците доверия к вам, попробуйте сослаться на рекомендацию кого-нибудь из тех, кому предполагаемый респондент доверяет.

5. Обязательно имейте при себе документы, удостоверяющие личность спонсора опроса и вашу (на случай возможных недоразумений).

Направленное интервью нельзя проводить по правилам, годным для выборочного опроса. Декстер пишет, что “почти универсальным правилом для направленного и специализированного интервью является то, что лучший способ интервьюирования в конкретной ситуации определяется самой этой ситуацией (включая сюда знания и черты личности интервьюеров)”⁴. При направленном интервью по сравнению с выборочным опрашивающий должен проявлять в целом большую гибкость и большее разнообразие в стиле ведения интервью. Можно, однако, предложить несколько общих советов, пригодных для большинства случаев.

1. В начале интервью обязательно представьтесь и изложите вкратце задачу вашего исследования; не полагайтесь на то, что респондент усвоил все это из вашего письма или из предыдущей встречи с вами.

2. Решающее значение может иметь обстановка, в которой берется интервью. По возможности следует исключить из нее отвлекающие факторы. Например, попытки взять интервью во время обеда в ресторане или в присутствии детей респондента обычно кончаются неудачей. Однако в некоторых случаях бывает полезно провести интервью в необычном месте (в парке, автобусе, музее), с тем чтобы создать непринужденную атмосферу или оживить в респонденте воспоминания о прошлых событиях.

3. Хотя групповые интервью иногда могут помочь достигнуть консенсуса в оценке некоторых фактов, а также выявить личные взаимоотношения в группе, все же лучше опрашивать одновременно не более одного человека.

4. Проводите интервью вдумчиво и в дружеском тоне. Не выпаливайте скороговоркой все вопросы подряд. Не бойтесь пауз, нужных вам или респонденту, чтобы собраться с мыслями.

5. Тщательно продумайте, какие вопросы вы зададите первыми. Притом что основная часть интервью лишена плана, первые несколько вопросов очень важны, так как они [c.242] фокусируют внимание респондента, стимулируют его память и проясняют для него, чего именно вы от него хотите. Начальные вопросы должны быть: (а) непосредственным образом связаны с объявленной вами задачей исследования, (б) достаточно нейтральны, чтобы респондент мог на них ответить без каких бы то ни было опасений, (в) сформулированы таким образом, чтобы показать респонденту, что опрашивающий знаком с предметом исследования, (г) рассчитаны на получение свободных и непринужденных ответов, а не плоских или сухих (если вам нужны чисто фактические сведения о респонденте, вы успеете получить их далее в ходе интервью). Особенно полезны в качестве вступительных те вопросы, где делается упор на отношение респондента к исследуемому явлению или на его понимание этого явления.

6. В отличие от выборочного интервью вопросы направленного интервью должны допускать множественные интерпретации. Помните, что ваша задача – узнать, что думают о явлении и что ощущают в связи с ним сами респонденты.

7. Помочь спровоцировать нужный ответ, помимо прямого вопроса, может также комментарий. Например, замечание типа “Ну, обыкновенно это делается не так” может вызвать со стороны респондента ответное рассуждение о том, как, по его мнению, “это делается”.

8. Всегда смотрите по возможности респонденту в глаза (если только это ему не неприятно), так чтобы он видел, что вы его внимательно и сочувственно слушаете. Простые фразы типа “Я понимаю...” или “Конечно...” или вдумчивое “Да...” помогут вам подбодрить респондента и разговорить его. Помните, что основное вознаграждение, которое респондент получает за развернутое интервью, – это возможность “просветить” кого-то, кому знаком и искренне интересен тот предмет, который для него самого очень важен. Поэтому полезно бывает дать респонденту понять, что он действительно помогает вам своей информацией.

9. С комментариями респондентов, каковы бы они ни были, лучше, по-видимому, соглашаться. Не показывайте респонденту, что вы не согласны с его мнением или сомневаетесь в приводимых им фактах.

10. Исключение из правила 9 составляют те случаи, когда [c.243] респондент не хочет выдавать вам информацию, которой он, как вам кажется, располагает. Здесь может оказаться необходимым применить так называемую “методику Наделя”⁵. Она состоит в том, что опрашивающий берет на себя роль критика или оппонента респондента, стараясь оспаривать и ставить под сомнение его тезисы в надежде, что в споре тот проговорится. Для выведывания нужной информации может пригодиться даже определенная доля враждебности.

11. Респондента, который избегает разглашать информацию, потому что боится, что ею могут злоупотребить, иногда удается разуверить в его опасениях, напомнив, что опрос носит строго конфиденциальный характер и что исследователь ни в коей мере не в состоянии повлиять на сложившееся положение дел.

12. Ведение записей по ходу интервью – один из способов увеличить его результативность. При направленном опросе (в отличие от выборочного, когда заметки следует делать незаметно) то, как опрашивающий делает записи, может зачастую побудить респондента детализировать либо дополнить приведенную им информацию. Если вы тщательно все записываете, то для респондента это значит, что его комментарий для вас важен; если же вы откладываете ручку в сторону – это сигнал того, что респондент слишком далеко уклонился от основной темы. Поскольку вам придется вести столь пространные записи, что делать незаметно это невозможно, вы можете по ходу делать заметки по поводу всего, что достойно внимания.

13. Старайтесь приноровиться к стилю поведения и характеру респондента. Одним людям свойственно держаться подчеркнуто сухо, другие, наоборот, очень раскованны; одни оперируют почти исключительно отвлеченными понятиями, другие же стараются все приложить к себе и к своему опыту. Кто-то привык общаться главным образом с начальством, а кто-то в основном с подчиненными. И вы получите больше информации, если сможете перенять одну из этих ролей. Нельзя начинать интервью, заранее жестко определив, в каком стиле вы будете действовать – это можно решить лишь в ходе беседы с респондентом.

14. Обязательно просмотрите свои записи сразу после интервью, с тем чтобы записать свой комментарий к нему и проработать те пункты, которые вам удалось затронуть [c.244] лишь в общих чертах. Очень важно как можно меньше доверять своей памяти, даже если для этого вам придется провести пару часов в неуютном кафе или в промерзшем салоне автомобиля.

15. Свои рукописные заметки как можно скорее перепечатайте на машинке. Сделайте несколько экземпляров и храните их раздельно, чтобы не потерять.

Использование магнитофона при опросе имеет как свои плюсы, так и свои минусы. Магнитофон способен уловить изменение тона и помогает избежать искажений при передаче того, что было реально произнесено. Кроме того, он позволяет опрашивающему услышать себя со стороны. Это полезно, потому что то, как прозвучал вопрос, может оказаться существенным для интерпретации ответа. Сложность заключается в том, что магнитофон часто “затормаживает” речь респондента, поскольку лишает его возможности отказаться в дальнейшем от своих слов в случае, если возникнет какое-либо недоразумение. Иногда респондент боится, что запись может быть обнародована в искаженном виде. Кроме того, сама техника магнитофонной записи может отвлекать внимание респондента от опроса. Решение о том, использовать магнитофон или нет, в каждом конкретном случае исследователь должен принимать с учетом типа задаваемых вопросов и характера респондента. Если предмет обсуждения достаточно деликатен или если магнитофон респонденту “противопоказан”, то ясно, что издержки его использования перевесят преимущества. Если же предстоит длинное интервью со множеством технических подробностей и специфических фактов, ключевых для исследования, то магнитофон может оказаться незаменимым.

Используя магнитофон, не скрывайте его и помещайте так, чтобы он находился у респондента перед глазами. Заранее проверьте его в действии, чтобы убедиться, что он подходит для данного вида работы (обладает достаточной чувствительностью, прост в эксплуатации, способен обеспечить нужную продолжительность записи). Никогда не полагайтесь целиком только на магнитофон. Он может забарахлить, а это приведет к безвозвратной потере текста интервью. Поэтому всегда параллельно ведите запись от руки на бумаге⁶.

Наконец, важная проблема при направленном опросе – это его конфиденциальность, которая играет здесь [c.245] более важную роль, чем при выборочном, поскольку от респондента требуется зачастую такая информация, которая в случае злоупотребления ею или ее обнародования может привести к нежелательным социальным последствиям. Гарантируя конфиденциальность интервью (а делать это надо непременно), исследователь должен приложить все усилия, чтобы сохранить секретность информации. Сделать это зачастую даже легче, чем при выборочном опросе, поскольку в направленный опрос обычно вовлечено меньше обеспечивающего его персонала, и если исследователь будет хранить сделанные записи в надежном месте, то существует определенная гарантия, что они не станут достоянием гласности. Опасность разглашения тайны возникает чаще всего, когда для перепечатки рукописной или магнитофонной записи исследователь прибегает к услугам машинистки. Уж если он совершенно не в состоянии сделать эту работу сам, то надо по крайней мере использовать услуги только проверенных людей и по возможности хранить личность респондента в тайне от машинистки. Нельзя допускать доступа посторонних лиц к материалам опроса. [c.246]

СПЕЦИАЛИЗИРОВАННОЕ ИНТЕРВЬЮИРОВАНИЕ

При некоторых типах исследований политологи нуждаются в информации, полученной не от уникальных в своем роде респондентов, как в случае направленного интервьюирования, и не от респондентов, представляющих население в целом, как при выборочном опросе, а от типичных представителей какой-то достаточно узкой группы населения. Это вызывает необходимость провести специализированное интервью.

Специализированным является любой опрос, при котором наличие у респондента определенных особенностей требует использования иной опросной техники, нежели при стандартном выборочном опросе. Опрос детей, неграмотных взрослых, заключенных, бродяг из трущобных районов, душевнобольных, рабочих-иммигрантов, не владеющих английским языком, – все это примеры специализированного опроса. Такой опрос отличается от выборочного целым рядом черт. Во-первых, при специализированном опросе случается, что исследователь и респондент говорят на разных языках. Употребляемые [c.246] исследователем слова респонденту могут быть подчас непонятны. И точно так же респондент может употреблять жаргонные слова, неизвестные исследователю, или же использовать обычные слова в непонятном для исследования значении. Вторая отличительная черта специализированного опроса заключается в том, что исследователь не вправе ожидать от респондента умения читать, рассуждать или следить за развитием чужой аргументации, т.е. навыков, привычных для обычного культурного человека. Вдобавок ко всему этому определенное своеобразие в процесс коммуникации между респондентом и опрашивающим привносит и сама ситуация специализированного опроса. В то время как обычные респонденты смотрят на опрашивающих большей частью как на равных, к которым можно относиться дружелюбно и с доверием, респондент специализированного опроса вполне может держаться недоверчиво или враждебно, рассматривая опрашивающего как представителя власти. В таких условиях общение может быть сильно затруднено; может снижаться и надежность ответов.

В силу всего этого исследователь при специализированном интервьюировании не должен думать, что нормальное общение с респондентом сложится само собой. Напротив, контакт с респондентом нужно налаживать постепенно, и, только удостоверившись в его наличии, можно приступать к опросу.

Рассмотрим следующий пример. Если мы хотим узнать, насколько легитимной, по мнению школьников, является американская политическая система, то нам прежде всего придется определить понятие “легитимность”, а также удостовериться, что наши юные респонденты правильно понимают, что мы имеем в виду, когда говорим “политическая система”. Убедившись в том, что они усвоили эти понятия, и задав затем наши основные вопросы, мы должны будем задать также и дополнительные, контрольные вопросы, с тем чтобы определить, придают ли школьники своим ответам то же значение, какого можно было бы ожидать, если бы эти ответы исходили от взрослых людей. Для этого можно воспользоваться таким приемом: предложить нашим респондентам примеры, в которых школьники ведут себя так, что оценка ими степени легитимности того или иного учреждения однозначно ясна, [c.247] и попросить затем каждого из респондентов проинтерпретировать описанные в примерах действия в терминах легитимности и сказать, стал бы он сам вести себя подобным образом или нет. Если респондент толкует эти вымышленные действия неверно или если он допускает, что мог бы совершить действие, несообразное с тем пониманием легитимности, которое он ранее продемонстрировал нам на словах, то вряд ли мы можем считать, что данный респондент понимает свои ответы в том же смысле, что и мы.

ВЫВОДЫ

Интервьюирование может быть очень богатым источником сведений для социолога. Однако чтобы быть эффективным, интервьюирование требует от исследователя почти артистических навыков. Никакая литература не может заменить в этом деле практического опыта. [c.248]

8-лекция. ШКАЛИРОВАНИЕ

Одна из проблем, наиболее часто встречающихся при планировании опроса и подготовке инструментария для него, заключается в том, каким образом следует приписывать единое репрезентативное значение или оценку (score) некоторому сложному отношению или поведению. В качестве примера рассмотрим, как можно было бы измерить предубежденность населения против студентов колледжей. Такая предубежденность может проявляться в самых разных формах в зависимости от того, на каких признаках студентов сосредоточено внимание конкретного индивида (респондента). Так, некоторые люди судят о студентах по одежде, другие – по манерам, третьи – по поведению в повседневной жизни, по социально-экономическому статусу и даже по уровню личной гигиены. У иных стереотипное мнение могло сложиться на основании всего одной-двух встреч (приятных либо нет) с какими-то конкретными студентами; а кто-то, возможно, вообще едва ли способен отличить студента от других людей. Элементы суждения могут сильно варьировать по содержанию, направленности, степени оценки, но каждый и” них представляет собой – по крайней мере потенциально – компонент более широкого понятия “предубежденность”.

Если мы хотим учесть все эти моменты, то нам надо подобрать такой инструмент, который сумеет выявлять и измерять как можно больше подобных составных элементов понятий и одновременно будет достаточно точен, чтобы позволять осмысленным образом определять степень проявления общего понятия в единичном наблюдении. Иными словами, нам нужно такое средство, которое бы улавливало и отображало понятие, подобное понятию “предубежденность”, во всех деталях, а кроме того, показывало бы нам, сколько (какая доля) этого понятия содержится в том или ином случае или ответе респондента. Одно из таких средств называется шкалированием.

Шкалирование – это процедура объединения ряда относительно узких показателей (в нашем примере это пункты [c.250] опроса, касающиеся отдельных отмеченных респондентами признаков студентов) в единую суммарную меру, которая принимается за отображение более широкого основного понятия (в нашем случае – предубежденности), частью которого является каждый отдельный признак. Так, мы могли бы измерить отношение респондента к различным видам поведения студентов (например, к тому, сколько они употребляют алкогольных напитков, или к тому, сколь шумны их вечеринки) или к манерам студентов (к тому, насколько они чванливы, самонадеянны или невнимательны к другим людям), но ни один из этих признаков в отдельности мы не могли бы принять за полноценное отображение столь широкого понятия, как предубежденность. Нам скорее следовало бы каким-то образом свести все эти меры воедино, чтобы иметь возможность делать выводы о более общей точке зрения, которую каждая из них в чем-то дополняет и отображает. Более того, нам нужно решить эту задачу так, чтобы можно было сравнивать количество предубежденности (или любого другого измеряемого нами понятия), содержащееся в ответе одного респондента, с количеством ее, содержащимся в ответе другого респондента, и в конечном итоге судить о том, кто из респондентов предубежден более.

Унифицирующая мера, отображающая определенное основное понятие, называется шкалой. Частное значение степени проявления в каждом данном случае основного понятия называется шкальной оценкой. Шкалирование, или построение шкалы, – это процедура, с помощью которой исследователь формирует шкалу и приписывает отдельным случаям оценки на этой шкале. [c.251]

ПОСТРОЕНИЕ ШКАЛЫ: ДВЕ ОСНОВНЫЕ ПРОБЛЕМЫ

Из вышеизложенного шкалирование может показаться достаточно простой, прямолинейной процедурой, когда в задачу исследователя входит просто идентифицировать ряд компонентов основного понятия, установить, каким показателем можно измерить каждый из них, затем объединить эти показатели в суммарную оценку с помощью произнесения нескольких волшебных слов или статистических заклинаний, и – раз-два! – дело сделано. К сожалению, эта видимая простота обманчива, потому что при отборе и интерпретации [c.251] компонентов шкалы нам может встретиться целый ряд подводных камней, требующих особой внимательности. С наиболее существенными из них мы уже знакомы – это проблемы, связанные с понятиями валидности (обоснованности) и надежности.

Валидность, как вы помните, – это свойство, определяемое ответом на вопрос: “Действительно ли мы измеряем именно то, что хотим измерить?” В теперешнем нашем контексте этот вопрос может быть несколько трансформирован следующим образом: “Есть ли основания полагать, что каждый из отдельных компонентов шкалы (каждый из конкретных вопросов) действительно напрямую связан с основным понятием и что все компоненты в совокупности полностью охватывают это понятие?” Иначе говоря, мы должны задаться вопросом: “А есть ли реальный смысл в том, чтобы объединять между собой ряд частных показателей, и – коли уж мы это сделали – есть ли смысл навешивать на этот ряд показателей избранный нами ярлык основного понятия?” Так, обращаясь снова к примеру со студентами, мы должны спросить себя, во-первых, действительно ли мнение человека о поведении студентов непосредственно связано с его мнением о студенческом стиле одежды или о манерах студентов, и во-вторых, действительно ли все эти мнения в совокупности отражают степень предубежденности данного лица против студентов.

Что касается надежности, то она определяется ответом на вопрос: “Вне зависимости от того, что конкретно мы измеряем, последовательно ли мы это делаем?” Применительно к шкалированию этот вопрос трансформируется в заботу о том, чтобы различные показатели, являющиеся компонентами шкалы, были связаны друг с другом последовательным и осмысленным образом. На деле нас интересует здесь не то, позволяет ли данный набор вопросов или показателей отличить яблоки от апельсинов, а скорее то, позволяет ли этот набор последовательно сортировать уже идентифицированные нами яблоки по размеру, цвету и т. п. в соответствии с некоторым стандартом. Если да, то объединение различных мер будет говорить о яблоках больше, чем любая отдельная мера. Но если наши стандарты (цвета, размера и т. п.) непоследовательны или [c.252] двусмысленны, то основанные на них наблюдения могут оказаться ложными.

Возможно, другой пример поможет сделать эти положения более понятными. Рассмотрим некую шкалу, предназначенную для того, чтобы каждый респондент выразил свое согласие или несогласие со следующими утверждениями:

1. Кубинцы дурны, и им нельзя верить
2. Французы дурны, и им нельзя верить
3. Японцы дурны, и им нельзя верить
4. Китайцы дурны, и им нельзя верить.

Давайте представим, что перед нами шкала для измерения ксенофобии, то есть страха и недоверия к иностранцам. Предположительно, чем с большим количеством утверждений согласится респондент, тем выше уровень ксенофобии, который мы можем ему приписать. Но будет ли дело обстоять именно так? Человек, полагающий, что только кубинцы дурны и им нельзя верить, утверждает это более в силу антикоммунизма, чем ксенофобии. В свою очередь человек, полагающий, что только японцы и китайцы дурны и им нельзя верить, утверждает это более в силу расизма, чем ксенофобии. И даже респондент, считающий, что все четыре группы дурны и им нельзя верить, как выясняется при ближайшем рассмотрении, страдает не ксенофобией, а скорее чувством, что все люди, или все правительства (даже той страны, где он живет) дурны и им нельзя верить. И следовательно, поскольку мы не можем с уверенностью утверждать, что эта шкала измеряет ксенофобию по существу, то эта шкала несостоятельна. И можем ли мы вообще доверять ей? Составлена ли она продуманно даже для измерения уровня ксенофобии? Страх и недоверие к китайцам, например, возможно, являются индикатором по меньшей мере двух совершенно различных особенностей, одна из которых идеологическая, вторая же имеет своей причиной расизм, и два респондента могут дать одинаковый ответ по совершенно разным причинам. И будет ли одинаковым чувство ксенофобии у антикоммуниста и расиста? Скорее всего – нет. Таким образом, механическое соединение этих конкретных пунктов с целью их соизмерения в лучшем случае будет [c.253] лишь тщетным упражнением, а в худшем – станет источником ошибочных умозаключений.

Проблемы подобного рода преодолеть не всегда просто, и ввиду этого при шкалировании нужно действовать очень внимательно, заранее все просчитывая. Тем не менее возможность представления сложного отношения или поведения в виде отдельного числа или оценки, являющаяся неоспоримым преимуществом шкалирования, служит стимулом к использованию этой методики во множестве самых разнообразных случаев. В этой главе мы обсудим четыре различных подхода к построению значимых (meaningful) шкал. При этом будут рассмотрены достоинства и недостатки каждого из них в том, что касается решения проблем валидности и надежности, а также присущие каждому из этих подходов процедуры. [c.254]

ШКАЛИРОВАНИЕ ПО ЛАЙКЕРТУ

Первый и, по-видимому, наименее удовлетворительный из методов шкалирования известен под названием шкалирования по Лайкерту. Это очень простая методика, в соответствии с которой каждому респонденту предъявляется некоторая серия утверждений (пунктов), требующих от него оценочных суждений. В табл. 8.1 приведена в качестве примера типичная серия таких пунктов, которые могли бы служить мерой антистуденческой предубежденности населения¹. В каждом случае респонденту предлагается сказать, согласен (или полностью согласен) он или не согласен (или полностью не согласен) с приводимым утверждением. Каждому ответу приписывается определенная числовая оценка в диапазоне от 5 до 1 (5 – “полностью согласен”, 1 – “полностью не согласен”, 3 – “не имею определенного мнения”). Чтобы получить суммарную меру предубежденности, свойственной конкретному индивиду, нужно сложить все оценки, проставленные против его ответов, и сумму разделить на число утверждений (пунктов). Так, например, респонденту, ответившему на вопросы 1–6 следующим образом: по пункту 1 – “согласен” (4), по пункту 2 – “полностью согласен” (5), по пункту 3 – “не имею определенного мнения” (3), по пункту 4 – “согласен” (4), по пункту 5 – “не согласен” (2), по пункту 6 – “согласен” (4), – будет приписана суммарная оценка 3,67 ([4+5+3+4+2+4]:6), округляемая до 4. [c.254]

=================================================================

Таблица 8.1

Типичные пункты шкалы Лайкерта

=================================================================

Против каждого из следующих утверждений укажите, пожалуйста, согласны ли Вы с ним, полностью согласны, не согласны или полностью не согласны.

1. Студенты, за редкими исключениями, все очень похожи друг на друга.

2. Со студентами сложность состоит в том, что, где бы они ни поселялись, они постепенно вносят в жизнь округи дух студенческого общежития.

3. Чтобы положить конец предубежденности людей против себя, студентам необходимо самим первым избавиться от своих вредных и раздражающих других привычек.

4. В студентах есть что-то чуждое и непонятное мне; неясно, о чем они думают, что замышляют, чем живут.

5. Студенты в большинстве своем готовы сесть вам на голову, если их вовремя не осадить.

6. Пример студентов подтверждает, что если таким людям предоставить в избытке деньги или свободу, то они начнут этим просто злоупотреблять и доставлять другим неприятности.

--------------------------------------------------------------------------------------------------------------

Источник: В сокращенном виде приводится по кн.: Adorno Th. et al. The Authoritarian Personality. – N.Y.: Harper & Row, 1950.

=================================================================

Предполагается, что, чем выше оценка, получаемая респондентом в рамках данной шкалы, тем большим количеством измеряемого признака (в нашем примере – предубежденности против студентов) он обладает. Недостаток шкал этого типа состоит в том, что мы ничего не знаем о взаимодействии между отдельными компонентами шкалы. Каждый из них действительно может измерять разные аспекты одного и того же основного признака, и на первый взгляд так оно и есть, однако мы не можем быть в этом абсолютно уверены. При использовании шкал Лайкерта в политологии исследователи часто пытаются обойти это затруднение, удостоверившись в том, что между пунктами шкалы существует высокая степень корреляции, но при этом зачастую нарушаются некоторые статистические допущения, касающиеся измерения степени корреляции. В общих чертах эта проблема будет рассмотрена в гл. 16. Однако уже здесь следует оговорить один связанный с нею момент, а именно то, каким способом определяется суммарная (средняя) оценка. Мы просто складываем оценки отдельных пунктов и делим сумму на число пунктов. Но если поближе присмотреться к типам [c.255] ответов (т. е. “полностью согласен”, “согласен” и т. д.), то мы обнаружим, что они представляют измерение на порядковом уровне. То есть они различают взаимоисключающие категории и упорядочивают их относительно друг друга (сообщают, в какой степени респондент согласен или нет с некоторым утверждением). Однако они не устанавливают известных и равных интервалов между собой (разница между “полностью согласен” и “согласен” не всегда одинакова, касается ли это разных пунктов шкалы или разных респондентов). И следовательно, бессмысленно и некорректно складывать эти числа друг с другом, не говоря уже о том, чтобы их усреднять. Более правильная (однако редко применяемая) процедура состоит в вычислении на основании ответов каждого респондента средней величины другого вида – медианы, – которая затем приписывается респонденту в качестве оценки шкалы. Способ определения медианы описан ниже, в гл. 14. [c.256]

ШКАЛИРОВАНИЕ ПО ГУТТМАНУ

Многие из сложностей, связанных со шкалированием по Лайкерту, могут быть при определенных условиях преодолены посредством использования более сложной методики, известной под названием шкалирования по Гуттману. Эта методика исходит из допущения, что некоторые типы поведения (и отношений) связаны друг с другом так, что следование одним из них достигается с большим трудом, чем следование другим. По-видимому, самой лучшей аналогией тут может служить пример с человеком, стоящим на лестнице-стремянке. Если человек стоит на пятой по счету от земли перекладине, то, по всей видимости, он взобрался туда, ступая сначала на первую, потом на вторую, третью, четвертую перекладины. Возможно, но менее вероятно, что этот человек перескочил при движении вверх через одну (или более) перекладину. Совсем маловероятно, чтобы он мог без особого неудобства для себя встать на пятую перекладину, ступая прямо с земли. Таким образом, данный субъект достиг пятой перекладины, проделав целую серию все более высоко расположенных движений, и мы имеем полное основание [c.256] допустить, что для достижения более высокой позиции он преодолел нижние.

Точно так же если мы знаем, что некий индивид принял участие в голосовании на президентских выборах (что, как известно из многих исследований, является одним из самых обычных и наименее обязывающих политических действий), то мы не можем с какой-либо долей уверенности утверждать, что этот человек также активно участвует в деятельности какой-либо политической организации (намного более обязывающее и менее обычное действие) или что он баллотировался на какой-либо государственный пост (одно из самых редких политических действий). Однако с другой стороны, если мы знаем о данном индивиде, что он активно участвует в деятельности какой-либо политической организации, то мы можем с достаточной уверенностью утверждать, что он также участвует и в таком менее значительном политическом действии, как голосование на выборах (хотя не можем утверждать, что он сделал и следующий шаг, а именно баллотировался кандидатом на выборах). И далее, если данный индивид баллотировался в качестве кандидата на государственный пост, то у нас есть все основания полагать, что он также принимал участие в голосовании и в деятельности некоторой политической организации. На практике подобные допущения оказываются верными не всегда, но очень часто.

Некоторые отношения связаны друг с другом очень похожим образом. Это иллюстрирует табл. 8.2, в которой представлен один из альтернативных способов измерения степени предубежденности того или иного индивида против студентов². Процедура схожа с той, которая используется при шкалировании по Лайкерту, и состоит в том, что респондентов просят ответить, согласны они или нет с каждым пунктом (утверждением) из некоторой серии. Тому ответу, который в большей степени отражает измеряемое свойство (например, предубежденность), приписывается знак “+”, а альтернативным ответам – знак “–”. Так, к примеру, согласие с пунктом 1 будет оценено как “+” (наличие предубежденности). Тогда как несогласие с пунктом 2 получит оценку “–” (отсутствие предубежденности). Сами утверждения, как нетрудно видеть, связаны между собой таким образом, что различные ответы на них отражают степень предубежденности (или свободы от таковой) респондента. На деле, чем ближе “угроза” общения со студентами касается самого респондента или его семьи, тем ему, по-видимому, труднее освободиться от предубеждения. Это значит, что между пунктами шкалы существует, по меньшей мере в потенции, вполне логичное отношение порядка, отсутствующее в Лайкертовых шкалах.

=================================================================

Таблица 8.2

Типичные пункты шкалы Гуттмана

=================================================================

Укажите, пожалуйста, согласны Вы или не согласны с каждым из следующих утверждений:

1. Если бы мне было дано выбирать, я бы предпочел не видеть студентов в нашей округе.
2. Я не возражаю против появления студентов в нашей округе.
3. Я бы не возражал, если бы какие-нибудь студенты захотели поселиться у нас в округе.
4. Я бы не хотел, чтобы у нас в округе жили студенты.
5. Я ничего не имел бы против, если бы кто-то из нашей семьи привел к нам в гости студента.
6. Мне не понравилось бы, если бы кто-то из нашей семьи собрался сочетаться браком со студентом / студенткой.

--------------------------------------------------------------------------------------------------------------

Источник: В сокращенном виде приводится по кн.: Bogardus E. Social Distance. – Yellow Springs, Ohio: Antioch Press, 1959.

=================================================================

Более того, шкалирование по Гуттману обеспечивает не только адекватный способ вычисления степени признака, характерной для данного респондента, но и прежде всего способ оценки степени соответствия определенного набора компонентов допущению об их упорядочиваемости (assumption of ordinality). Эти способы могут быть проиллюстрированы с помощью табл. 8.3, где отображены ответы 170 гипотетических респондентов на утверждения, приведенные в табл. 8.2.

Некоторые детали этой таблицы нуждаются в пояснении. Начать с того, что пункты упорядочены в направлении слева направо в порядке возрастания числа полученных ими при ответах плюсов (+). Это число получается в результате подсчета числа (n) всех тех случаев, когда ответ на данный пункт получил оценку “+”. (В данной таблице эти числа, помеченные внизу каждого столбца, выбраны произвольным образом.) [c.258]

Основное допущение заключается в том, что число плюсов должно уменьшаться по мере возрастания трудности следования определенному типу поведения / отношения (или по мере возрастания его экстремальности). В данном примере результаты такого упорядочения совпадают с нашими ожиданиями в том смысле, что наблюдаемое упорядочение соответствует нашему изначальному упорядочению. Однако так бывает далеко не всегда.

Каждая строка таблицы представляет группу респондентов, давших на предложенные шесть пунктов вполне определенный набор ответов. Так, первая строка сверху представляет тех 10 респондентов (n=10), чьи ответы на все шесть вопросов свидетельствуют о наличии у них сильной предубежденности против студентов. Вторая строка сверху представляет тех 20 респондентов, чьи ответы указывают на наличие предубежденности по всем пунктам, кроме пункта 1, и т. д. Первые семь строк таблицы представляют те наборы ответов, которые полностью соответствуют допущению о [c.259] том, что данные шесть пунктов связаны между собой отношением порядка. Группы респондентов, для которых характерен любой из этих семи наборов ответов, называются типами идеальной шкалы (perfect scale types).

При шкалировании по Гуттману количество типов идеальной шкалы всегда на единицу больше числа пунктов данной шкалы, поскольку полное отсутствие измеряемого свойства (отсутствие предубежденности, как в строке 7) рассматривается как идеальная оценка (perfect score). Каждой идеальной оценке приписывается число от 1 до i+1, где i – количество пунктов (items) шкалы, причем 1 обозначает тех респондентов, которые в наименьшей степени обладают измеряемым свойством, а i+1 – тех из них, кто обладает им в наибольшей степени. Таким образом, каждому респонденту приписывается соответствующая оценка. Так, в нашем примере каждый из 10 респондентов строки 1 (чьи ответы отражают самую высокую степень предубежденности) получает оценку 7 (i+1 = 6+1 =7), каждый респондент из строки 2 – оценку 6 и т. д. до оценки 1, выставляемой каждому респонденту из строки 7. Эти оценки ранжируют (упорядочивают) всех респондентов соответственно степени их предубежденности против студентов.

Нам осталось объяснить строки 8, 9 и 10. Один или более ответов из этих строк не укладываются в предсказанный нами заранее порядок пунктов. На самом деле это ответы тех, кто, взбираясь по лестнице, перескочил через одну или более ступенек. О подобных наборах ответов принято говорить, что они содержат одну или более ошибок (errors). Термин “ошибка” обозначает здесь не оплошность респондента, а несоответствие данных случаев основному допущению шкалирования по Гуттману. Встречая подобные ошибки – а они вполне обычны, – мы вынуждены обратиться к следующей процедуре.

Прежде всего следует подсчитать, какое число изменений в строке минимально необходимо для того, чтобы получить идеальную оценку. К примеру, в строке 8 плюс в столбце 1 можно изменить на минус, в результате получим оценку 5; или, наоборот, изменив минус в столбце 2 на плюс, получим оценку 7. И в том, и в другом случаях мы внесли изменение [c.260] только в один пункт, поэтому мы можем сказать, что строка 8 содержит одну ошибку. Это обстоятельство отмечено в столбце под названием “Ошибка” – “Error” (e). Затем мы умножаем число ошибок (т.e. 1) на число случаев, в которых встретились данные ошибки (т.e. 30), и результат заносим в следующий столбец. И наконец, каждому случаю мы приписываем ту оценку шкалы, которую он получил бы, если бы не было ошибок (ошибки). Хотя в строке 8 всего одна ошибка, у нас имеется выбор из двух возможных исправлений – либо на оценку 5, либо на оценку 7. За исключением тех случаев, когда есть какое-то веское основание предпочесть одну из этих оценок другой, стандартная практика заключается в том, чтобы приписывать каждому из 30 респондентов ту или иную оценку шкалы (5 или 7) случайным образом.

Далее переходим к строке 9 и повторяем ту же процедуру. Здесь нам придется произвести минимум два изменения, обратив два минуса в плюсы. И опять мы отмечаем число ошибок, умножаем его на число случаев и приписываем каждому определенную оценку шкалы. Здесь, однако, возможна только одна оценка, поскольку возможен только один вариант внесения исправлений.

Затем эта же процедура повторяется для строки 10, равно как и для любых других наборов ответов, отклоняющихся от основного допущения шкалы.

Работая со строками 8, 9 и 10, мы, конечно, приписывали оценки отдельным случаям (респондентам) так, как если бы они идеально укладывались в нашу шкалу, хотя нам известно, что это не соответствует действительности. Значит, в той мере, в какой мы полагаемся на оценки шкалы, характеризующие случаи из строк 8–10, мы рискуем прийти к ошибочным выводам. Встает вопрос, сколь велик этот риск. К счастью, шкалирование по Гуттману дает нам возможность ответить на него. Вспомним, что мы отмечали общее число ошибок в шкале. Оценка риска, по сути дела, требует, чтобы мы определили величину этой общей ошибки, т. e. оценили – то ли она относительно мала и потому пренебрежима, то ли настолько велика, что делает недействительной саму шкалу. Ответить на этот вопрос позволяет вычисление статистики, называемое коэффициентом воспроизводимости по Гуттману (the Guttman coefficient of reproducibility – С_R) и определяемое по следующей формуле: [c.261]

где n - число случаев в строках, содержащих ошибки,
е - число ошибок в каждой строке,
i - число пунктов шкалы,
N - общее число случаев.

Подставив соответствующие значения, получим коэффициент воспроизводимости для нашего примера:

В данной формуле величина Σn(e) обозначает общее число ошибок в шкале, тогда как величина i(N) обозначает общее число возможных ошибок, когда ни один из пунктов или респондентов не укладываются в шкалу. Таким образом, дробь говорит нам, какая доля всех возможных ошибок имела место в действительности. Вычитая эту долю ошибок из единицы, мы устанавливаем долю тех элементов (вхождений) шкалы, которые свободны от ошибок. Принято считать обоснованной любую шкалу Гуттмана с коэффициентом C_R > 0,90 и выше; шкалы с более низким коэффициентом рассматриваются как сомнительные и обычно в аналитических целях не используются³.

Таким образом, мы видим, что применительно к пунктам, поддающимся естественному упорядочению по степени трудности, шкалирование по Гуттману является сильным средством, с помощью которого мы можем объединять несколько показателей в единую суммарную величину, адекватно отображающую какое-то более общее свойство (признак) респондента. [c.262]

ШКАЛИРОВАНИЕ ПО ТЁРСТОУНУ

Еще один способ вычисления суммарных мер (хотя и предназначенный для решения несколько иных задач) – это равномерное (equal-appearing) интервальное шкалирование по Терстоуну. У нас уже шла речь о том, что при формулировке вопросов, нацеленных на измерение такой, например, переменной, как социальные классы, исследователь вправе избрать способ [c.262] измерения, опирающийся на какой-то объективный критерий (уровень доходов, общественный престиж профессии и т. п.), но альтернативно он может разрешить респонденту применять свои собственные критерии оценки (спрашивая его, например, к какому социальному классу он сам себя относит). Первый подход облегчает сравнение данных, полученных от разных респондентов, тогда как второй позволяет получить, возможно, менее сравнимые, но зато более значимые данные.

Шкалирование по Терстоуну рассчитано на вторую из этих стратегий с учетом, однако, улучшенного показателя сопоставимости. Метод состоит в том, что отдельным представителям изучаемой совокупности (группы населения) предоставляется возможность фактически самим участвовать в разработке тех шкал, которые в дальнейшем будут использованы для измерения определенных свойств данной совокупности (группы) в целом. Допуская интериоризованные определения значений тех или иных показателей, метод Тёрстоуна усиливает валидность шкалы. А устраняя из рассмотрения те пункты шкалы, с которыми не согласно большинство респондентов, он усиливает также ее надежность. Метод этот довольно сложен, но после того, как мы уяснили для себя его основные цели, он будет нетруден для понимания.

Приступая к построению шкалы Тёрстоуна, исследователь прежде всего отбирает большое количество утверждений (от 50 до 100), отражающих самые различные отношения к некоторому объекту. Затем из изучаемой группы населения произвольным образом отбирается некоторое число “арбитров”. Это те люди, на которых будет опробован имеющийся список утверждений. Обычно число арбитров достигает 50 и более человек, а иногда – если позволяют возможности – и нескольких сотен.

Каждому из арбитров предъявляется 11-балльная шкала, значения которой варьируют от “одобрительного отношения” (11) до “неодобрительного отношения” (1), и стопка карточек, на каждой из которых напечатано одно утверждение из имеющегося списка. Арбитра просят внимательно прочитать каждое утверждение и в зависимости от того, как оно связано с изучаемым объектом, поместить данную карточку в одну из 11 стопок, соответствующих той или иной [c.263] оценке. Таким образом, те утверждения, которые данный арбитр рассматривает как наиболее “одобрительные” по отношению к объекту (например, к студентам), попадут в стопку 11; те, которые он оценивает как несколько менее “одобрительные”, окажутся в стопке 10, и т. д. В итоге этой процедуры исследователь будет располагать мнением каждого арбитра об оценочном значении каждого утверждения.

На следующем этапе каждому утверждению приписывается определенная обобщенная оценка шкалы, указывающая на его относительное положение на шкале; при этом, чем более “одобрительным” видится арбитрам некоторое утверждение, тем выше его оценка. Многие исследователи вычисляют оценку шкалы, приравнивая ее к среднеарифметическому, т. е. сначала складывая все частные оценки какого-либо утверждения, а затем деля сумму на число арбитров⁴. Более надежный способ заключается в определении в качестве оценки шкалы медианного значения для каждого утверждения (см. гл.14). На данном этапе те пункты (утверждения), которые получили у разных арбитров сильно расходящиеся оценки (например, демонстрирующие разброс в диапазоне пяти или шести категорий шкалы), устраняются из списка. Окончательно в опросный лист попадают 15–20 пунктов, по которым арбитры ближе всего сошлись в опенках. В совокупности эти пункты должны покрывать весь диапазон оценок. В табл. 8.4 приведены некоторые типичные утверждения, которые могли бы быть включены в шкалу Тёрстоуна, предназначенную для измерения различных типов отношения населения к студентам⁵.

Далее, на этапе интервьюирования, респондента из обследуемой выборки просят сказать, с какими из предъявленных пунктов (утверждений) он согласен или – в альтернативном порядке – какие пункты (но не более двух-трех) наиболее близки к его мнению о рассматриваемом объекте (в нашем случае – о студентах). Затем для установленных таким образом пунктов определяется медианное значение⁶, каковое и приписывается данному респонденту в качестве его оценки шкалы, т. е. в качестве обобщения его взглядов на объект. В том случае, если ответы респондента оказываются разбросанными по нескольким несмежным точкам шкалы, исследователь обычно делает заключение, что [c.264] либо у данного индивида нет определенного отношения к исследуемому объекту, либо его отношение отлично от того, который подразумевается в данной шкале. Но если, как это чаще случается, ответы оказываются тесно сгруппированными на каком-то одном участке шкалы, исследователь вправе сделать вывод о валидности и надежности разработанной им меры. Этим он не в последнюю очередь обязан арбитрам, сыгравшим важную роль в построении исследовательского инструмента.

=================================================================

Таблица 8.4

Типичные пункты шкалы Тёрстоуна

=================================================================

Внимательно прочитайте следующие утверждения и укажите, с какими из них Вы согласны.

1. Возможно, это малоизвестно, но среди студентов процент добровольно поступивших на воинскую службу гораздо выше, чем среди других групп населения.
2. Некоторые из студентов, без сомнения, сильно превосходят по уровню интеллекта остальных жителей нашей округи.
3. Несмотря на все свои недостатки, студенты вносят большой вклад в улучшение жизни в нашей округе.
4. Представление о студентах как о людях менее целеустремленных и менее трудолюбивых, чем другие, мало соответствует действительности.
5. Одни студенты чистоплотны, другие – нет, но средний студент по своим личным привычкам ничем не отличается от среднестатистического гражданина.
6. Когда непосредственно сталкиваешься со студентами, то обнаруживаешь, что они такие же, как остальные люди: у них есть свои недостатки, равно как и свои достоинства.
7. Хотя, несомненно, встречаются исключения, но в целом студентам свойственна ярко выраженная тенденция к клановости, к тому, чтобы держаться замкнутыми группками.
8. Хотя, конечно, каждая социальная группа вправе выделяться среди других групп, студенты все же чересчур склонны не уважать права и собственность других людей.
9. Студенты иногда пытаются входить в не предназначенные для них магазины, отели и рестораны.
10. Многие жители нашей округи относились бы к студентам лучше, если бы в их поведении было меньше самоуверенности, аморальных поступков, случаев пьянства и публичной демонстрации сексуальной распущенности.
11. Хорошо известно, что от студентов пахнет хуже, чем от других людей.

--------------------------------------------------------------------------------------------------------------

Источник: Приводится в сокращенном виде по статье: Shuman H., Harding J. Prejudice and the Norm of Rationality. // Sociometry. 1963. Vol. 27. P. 353-371.

=================================================================

[c.265]

МЕТОД СЕМАНТИЧЕСКОГО ДИФФЕРЕНЦИАЛА

Четвертый, и последний, способ шкалирования, который мы хотим обсудить, называется методом семантического дифференциала. Этот метод основан на предъявлении респонденту некоторой серии пар прилагательных, с тем чтобы выявить, как данный индивид понимает определенное понятие (или как он к нему относится). В табл. 8-5 приводится типичная серия таких пар прилагательных. Респонденту предъявляется подобный список (выписанный обычно на отдельной карточке) и предлагается оценить определенный объект (в нашем примере – студентов) по 7-балльной шкале, на полюсах которой располагаются антонимические прилагательные. Измерение такого типа допускает варьирование как интенсивности (силы), так и направленности измеряемого отношения; при этом нейтральному отношению соответствует срединная точка шкалы. Порядок расположения прилагательных внутри каждой пары определяется случайным образом, чтобы избежать сдвига в сторону ответной тенденции.

=================================================================

Таблица 8.4

Типичные пункты при построении семантического дифференциала

=================================================================

Ниже перечислен ряд словесных пар, которые можно было бы использовать для описания студентов. Между членами каждой пары стоит несколько прочерков. Пометьте крестиком тот прочерк в каждой паре, который ближе всего соответствует Вашему мнению о студентах.

Студенты - это, как правило, люди:

1) скучные
2) чистоплотные
3) эмоциональные
4) мягкие
5) хорошие
6) нечестные
7) серьезные
8) идеалисты
9) шумные
10) приятные
11) богатые
12) деликатные
13) искренние
14) недалекие
15) полезные

— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —
— — — — — — —

интересные
грязнули
рациональные
несдержанные
плохие
честные
веселые
реалисты
тихие
неприятные
бедные
бесцеремонные
неискренние
глубоко мыслящие
никчемные[c.266]

Несмотря на то что некоторые исследователи делают под-разбивку таких шкал на различные более мелкие подшкалы и далее просчитывают результаты уже внутри каждой подшкалы, большинство все же сходится в том, что шкалы семантического дифференциала позволяют получать оценки несколько иного свойства, нежели другие рассмотренные нами методы. Эти шкалы пригодны в первую очередь для сравнения объектов между собой (обозначаются ли по видимости сходные объекты разными респондентами в сходных терминах?) или для формирования шкал, измеряющих более общие понятия (например, какие типы действий или взглядов рассматриваются респондентами как либеральные или консервативные?). И таким образом, метод семантического дифференциала выполняет в исследовательском процессе несколько иную и более фундаментальную задачу, чем методы Лайкерта, Гуттмана и Терстоуна, а именно помогает формированию и оцениванию дефиниций тех или иных понятий.

ВЫВОДЫ

Следует отметить, что существуют и другие методы шкалирования, используемые в опросных исследованиях. Однако те методы, что мы рассмотрели, являются самыми широкоупотребительными и–в очерченных нами пределах – самыми эффективными. В совокупности они обеспечивают нас доступными вариантами выбора и критериями, которыми нужно руководствоваться при формировании ограниченных мер для широких основных понятий.

9-лекция. КОНТЕНТ-АНАЛИЗ

Очень часто политолог может узнать об индивидах, социальных группах, учреждениях и даже о странах много нового, если он изучит связанные с ними информационные источники. Много ли информации о политических предпочтениях и способностях кандидатов содержится в предвыборных плакатах и в предвыборных сводках новостей? Может ли изучение внутреннего циркуляра крупной корпорации помочь обнаружить тайные планы ее администрации, направленные на подкуп представителей иностранных правительств, с которыми она собирается иметь дело? Насколько точна информация, публикующаяся в “Вестнике конгресса” (“Congressional Record”), о влиятельности того или иного американского сенатора? Отражают ли российско-американские дипломатические коммюнике состояние общественного восприятия тех изменений, которые происходят в российско-американских отношениях?

Лучший ответ на эти и другие вопросы может дать непосредственное изучение различных информационных источников. В целом эти источники можно подразделить на 3 категории: источники внутреннего происхождения (т.е. составленные изучаемым нами индивидом, учреждением или правительством) и внутренне ориентированные (например, служебные циркуляры, отражающие сам процесс принятия решения); источники внутреннего происхождения, но внешне ориентированные (такие публикации, как “Вестник конгресса”, в которых информация намеренно подается таким образом, чтобы сформировать у людей вполне определенный имидж источника, и которые, следовательно, могут как точно отражать, так и затемнять процесс и результаты принятия решений) и, наконец, источники внешнего происхождения, но внутренне ориентированные (например, предвыборная агитация, предоставляющая реципиенту исходный материал для принятия решений). Каждая из этих категорий источников может быть в большей или меньшей степени доступна или полезна для исследователя, но при этом все они в [c.269] равной мере обеспечивают возможность более глубокого проникновения в суть политического поведения.

Наиболее адекватным методом выявления такой возможности является контент-аналнз, т.е. систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника. Контент-анализ снабжает нас методом – вернее, серией методов, – с помощью которого мы можем обобщать те или иные материальные проявления поведения и отношений различных типов политических субъектов. В этой главе мы обсудим, когда следует применять контент-анализ, каковы основные приемы этой методики, как интерпретировать ее результаты и каковы пределы ее применения. [c.270]

ПОДГОТОВКА К КОНТЕНТ-АНАЛИЗУ

Контент-анализ может быть использован для ответа на исследовательские вопросы всегда, если имеется какой-то материальный носитель информации, так или иначе относящейся к интересующим нас политическим субъектам, и когда у исследователя есть доступ к этому информационному источнику. Примеры таких носителей – книги, памфлеты, журналы, газеты, фонограммы, аудио– и видеозаписи, фотографии, протоколы собраний или заседаний, правительственные документы, внутриведомственные циркуляры, фильмы, дипломатические коммюнике и инструкции, политические плакаты, карикатуры и лозунги, тексты речей и даже письма и дневники. Некоторые из этих носителей могут быть предельно подробными и точными (как, например, стенографический отчет о заседании конгресса) в отличие от других (например, от повестки дня того же самого заседания). Многие из них никак не зависят от исследовательского процесса (как, например, газетные публикации об изучаемом нами лице или организации), но есть и такие, которые исследователь должен воспроизвести сам (например, видеозаписи информационных телепрограмм). Однако все источники данных для контент-анализа имеют одну существенную черту: наличие материального носителя информации. Во всех случаях, когда он существует или может быть воссоздан, допустимо использование контент-анализа.

Первый шаг в подготовке к контент-анализу состоит в определении той совокупности сообщений, которую мы [c.270] будем изучать. Здесь перед нами открывается ряд возможностей. То, какая из них оптимальна, будет зависеть от конкретного исследовательского вопроса. Например, если объектом нашего исследования являются политические сюжеты в американской романистике XX в., то мы вправе определить искомую совокупность как все романы (тип сообщений), вышедшие из-под пера американских авторов (продуцент сообщений) и опубликованные в США (место распространения сообщений) в период между 1 января 1900 г. и сегодняшним днем (время появления сообщений). Если же нас интересует то, как освещалась в газетах определенная предвыборная кампания, искомая совокупность будет включать в себя все предвыборные газетные публикации (тип сообщений) размером в два и более газетных столбца (объем сообщений), опубликованные в ежедневных газетах (частота появления сообщений), которые были доставлены подписчикам (способ распространения сообщений) 6-го, 7-го и 8-го избирательных округов штата Огайо (место распространения сообщений) в период с 1 сентября по 5 ноября соответствующего года выборов (время появления сообщений).

Точно так же если мы хотим исследовать динамику развития напряженности в отношениях между США и Угандой в 70-е годы, то искомая совокупность может быть определена как все дипломатические послания (тип сообщений), которыми обменялись правительства США и Уганды (стороны, участвующие в процессе коммуникации) в течение определенного периода времени.

В каждом из этих примеров совокупность сообщений, подлежащих изучению, определяется с помощью набора заданных критериев, которым должно отвечать каждое сообщение. К этим критериям относятся: тип сообщений (романы, газетные публикации, дипломатические ноты), тип продуцента сообщений, стороны, участвующие в процессе коммуникации (отправитель, или получатель, или они оба), а также место распространения, частота появления, минимальный объем или длина, способ распространения и время появления сообщений. При необходимости могут быть использованы и другие критерии, однако те, которые перечислены нами выше, встречаются в большинстве исследований, где применяется контент-анализ. Первоочередная задача при подготовке к контент-анализу [c.271] состоит в том, чтобы выбрать среди этих критериев те, которые имеют наиболее непосредственное отношение к конкретному исследовательскому вопросу.

После того как мы определили совокупность сообщений, перед нами встает задача решить, какие из сообщений мы будем изучать наиболее детально. Поскольку подлежащие анализу случаи (сообщения) зачастую ограничены по числу и относительно хорошо доступны и поскольку контент-анализ в целом менее дорогостоящ (в расчете на каждое сообщение), чем другие методы (в особенности опрос), иногда удается подробно исследовать каждый случай (сообщение) из данной совокупности, т.е., по сути, произвести опись всех случаев. Именно возможность изучения большого количества случаев является одной из главных привлекательных черт контент-анализа как исследовательского метода. Чаще, однако, случается, что даже контент-анализ вынужден опираться на ограниченную выборку, взятую из более крупной совокупности.

Ввиду того что для документов, газетных статей и пр. обыкновенно существуют указатели или перечни, публикуемые в центральных изданиях и потому доступные для исследования, в контент-анализе из выборочных методов чаще всего применяются простой случайный отбор и систематический случайный отбор. Но даже тогда, когда необходимо выборочное обследование, размеры выборок для контент-анализа – благодаря доступности и относительной дешевизне исходных данных – обычно значительно превосходят те, которыми вынуждены довольствоваться другие виды исследования. Результатом этого, конечно же, является уменьшение ошибки выборки и повышение уровня надежности наших обобщений.

И наконец, готовясь к проведению контент-анализа, мы должны принять решение о единице измерения, или – если использовать более общеупотребительный термин – о единице анализа. В контент-аналитическом исследовании единица анализа – это просто отдельный элемент или признак того сообщения, которое мы собираемся изучать, обсчитывать или оценивать. Простейшим элементом сообщения является слово, и оно может быть использовано в контент-анализе наиболее непосредственным образом. [c.272]

Например, желая ответить на вопрос “Насколько интересовали проблемы мира во всем мире Р. Рейгана, Дж. Картера, Дж. Форда и Р. Никсона?”, мы могли бы взять выборки из выступлений каждого президента и подсчитать, сколько раз в тексте появится слово “мир” (и, возможно, некоторые другие, связанные с этим слова). Отвечая на вопрос “Какая страна – Израиль, Египет, Сирия или Саудовская Аравия – занимает наиболее миротворческую позицию по вопросам ближневосточного конфликта, если судить по выступлениям ее представителей в ООН в период с 1975 по 1990 г.?”, мы снова могли бы, взяв записи всех таких выступлений, подсчитать частоту появления слов типа “мир”, “братство”, “компромисс” и т.п. Таким образом, метод состоит в том, что устанавливаются определенные ключевые слова и подсчитывается частота их употребления в сообщениях.

Однако даже в столь простой процедуре надо следить за тем, чтобы избежать по меньшей мере двух характерных ошибок. Во-первых, следует помнить, что оперирование нестандартизированными мерами может приводить к смещениям в результатах. Если за рассматриваемый период времени представители Израиля в своих выступлениях произнесли 100 тыс. слов, причем интересующие нас ключевые слова были упомянуты ими 50 раз, а представители Египта произнесли 200 тыс. слов, включая 100 упоминаний соответствующих ключевых слов, то, исходя из этого, можно прийти к двум разным заключениям в зависимости от того, стандартизированы или нет наши показатели. Если мы просто подсчитаем общее число упоминаний ключевых слов, то у нас получится, что египтяне выказали вдвое большую заинтересованность в мирном урегулировании конфликта, чем израильтяне. Если же, однако, мы стандартизируем нашу меру так, чтобы с ее помощью можно было определять долю всех ключевых упоминаний (допустим, в расчете на каждую тысячу слов), то в итоге мы сможем заключить, что обе стороны одинаково заинтересованы в улаживании конфликта. Какой из этих подходов правильнее? Это основной вопрос при операционализации переменных, и ответ на него достигается успешнее всего, если более внимательно присмотреться к тому, как была изначально концептуализована исследовательская проблема. Дело в том, что использование даже [c.273] такого на вид конкретного показателя, как число произнесенных ключевых слов, может быть чревато определенной двусмысленностью. Исследователь должен видеть эту двусмысленность и уметь с нею справляться, поскольку принятые (или, наоборот, упущенные) в связи с этим решения могут оказать существенное влияние на окончательные выводы.

Вторая возможная ошибка, связанная с грубо прямолинейным подсчетом слов, состоит в том, что одно и то же слово может употребляться в самых разных контекстах, изменяющих его значение. “Мы стремимся к миру, но...”, “Арабское братство никогда не допустит...”, “О компромиссе не может быть и речи...” – при отсутствии каких-либо средств контроля такие упоминания слов “мир”, “братство”, “компромисс” будут сочтены упоминаниями в позитивном смысле, а это – самое меньшее – приведет к завышению оценки степени заинтересованности соответствующей стороны в достижении мирной договоренности. Если подобного рода употребления достаточно часты, они могут в конечном итоге совершенно нас дезориентировать. Поэтому когда мы беремся считать слова, то это следует делать с учетом контекста.

Тут у нас имеется по меньшей мере две возможности. С одной стороны, мы можем использовать мнения арбитров, или кодировщиков, т.е. членов исследовательской группы, в задачу которых входит прочтение и оценка контекстов ключевых слов с точки зрения их позитивности, негативности или нейтральности. Обычно, прежде чем будет достигнуто окончательное решение, каждое упоминание должно быть прочитано не менее чем двумя кодировщиками, оценки которых должны быть согласованы. (Позже мы еще вернемся к этому вопросу.) Подобные оценки контекста позволяют впоследствии подсчитать числовое соотношение позитивных и негативных упоминаний.

Другой возможный путь интерпретации отдельных слов в контексте (хотя это дает всего лишь частичное решение проблемы) состоит в том, чтобы добавить к рассмотрению вторую единицу анализа – тему. Тема – это некоторое вполне определенное сочетание слов или понятий, воплощенное во фразе, в предложении или даже в абзаце. Фактически, подсчитывая темы, мы занимаемся поиском упоминаний в тексте объектов обсуждения, например [c.274] в виде фраз “холодная война”, “проблема беженцев”, “государственное социальное страхование”, “христианское поведение”. Данная процедура является вариантом подсчета слов – но вариантом улучшенным в том отношении, что в состав тем входят пояснительный текст и слова-модификаторы (наречия, прилагательные), сопровождающие употребление конкретного слова и помогающие установить его значение.

Однако и в этой процедуре есть своя трудность. Дело в том, что хотя такой анализ действительно проясняет контекст употребления отдельных слов, но происходит это за счет значительного усложнения всей процедуры. Ведь одна и та же тема может упоминаться по-разному и с помощью самых разных словосочетаний. Иногда это – тонкий намек, почти или совсем лишенный тех эксплицитных признаков, по которым мы опознаём данную тему. Упоминание о “холодной войне”, например, вполне может быть завуалировано миротворческими словами о разрядке, а упоминание о христианском доброчестии может быть замаскировано националистической риторикой. Можно ли подобные слова и риторику считать ключевыми? Содержат ли они в себе данную тему или нет? На эти вопросы непросто ответить. Попытки сделать это заставляют приходить к четким, но ограниченным определениям, к формулировке целого ряда строго формализованных правил принятия решения (разрешающих, например, производить подсчет только по эксплицитным, заданным некоторым списком упоминаниям темы), которые делают наши результаты, возможно, более надежными, но одновременно и менее содержательными.

Третий элемент, часто используемый в исследованиях с применением контент-анализа, – это собственно предмет как таковой, рассматриваемый в целом. Каков процент книг, пропагандирующих социализм, опубликованных в США в 1935 году? Какому кандидату в президенты в 1992 г. симпатизировало наибольшее количество редакций газет? Как письма, написанные Ричардом Никсоном после того, как он ушел со своего поста, отличаются от писем, написанных ранее? В каком из этих случаев мы обрабатываем несущий информацию блок как некую целую единицу и изучаем его общие, всеохватывающие характеристики. Какой конкретный вопрос рассматривается в [c.275] этом случае? Отражаются ли определенные ценностные установки или пристрастия? При рассмотрении таких вопросов притупляется острота взгляда, необходимого при анализе более мелких структур. Неизбежным становится присвоение обобщающих определений, но именно в силу этих причин их анализ обычно легче выполнить, чем анализ слов или тем, в том смысле, что исследователю приходится делать меньше запросов. И это действительно так, поскольку можно оперировать переменными достаточно нейтрального уровня, – уровня, на котором события (то есть происшествия заметные, яркие) часто более очевидны и на котором оценки более достоверны.

Предметное изучение употребления слов и тем в последнее время стало легче проводить благодаря развитию компьютерных баз данных, таких, как LEXIS/NEXIX. Предположим, к примеру, что мы хотим узнать, как часто Дж. Буш сравнивал Саддама Хусейна с Гитлером в течение месяца, предшествующего войне 1991 г. в Персидском заливе. Используя NEXIS, мы можем сделать запрос на полнотекстовое исследование всех статей в “Нью-Йорк Тайме” (и любых других газетных статей и текстов передач широкого вещания), в которых слова “Дж. Буш”, “Саддам Хусейн” и “Гитлер” встречаются в хронологический период, выбранный для изучения. Тогда в соответствующем файле, с учетом особенностей пакета и языка, можно будет написать команду примерно следующего вида:

((George Bush) OR (President Bush) AND ((Saddam Hussein) w/10 Hitler)) AND (Date = September 1990)

Это длинное выражение задает команду, по которой в любой статье, опубликованной в сентябре 1990 г., будет опознан, во-первых, поименованный мистер Буш, а во-вторых, мистер Хусейн, если его имя отстоит в тексте от слова “Гитлер” не более чем на 10 слов в любую сторону. Такой запрос позволяет нам, кроме всего прочего, проверить (1), упоминалось ли имя мистера Буша вместе с его титулом чаще, чем без титула в то время, как становилось все яснее, что кризис будет разрешен военным путем (поскольку было бы возможно предположить ситуацию, что средства массовой информации неуловимо будут повышать весомость статуса президента, по мере того как [c.276] нация приближается к войне); (2) по сравнению с другими политиками мистер Буш лидировали или отставал по числу использования имени “Гитлер” в различных аналогиях, или (3) бесконечное число других гипотез, относящихся к формулированию восприятия конфликта обществом.

Результаты обобщенного анализа во многих отношениях не менее содержательны, чем результаты компонентного. Какой факт важнее: то, что египтянами в ходе одного из выступлений в ООН семь раз было упомянуто слово “мир”, или же то, что ими была произнесена в целом миротворческая речь? Более важно, посылали ли США в Ирак ноту с четырьмя открытыми упоминаниями об интервенции, тремя скрытыми намеками на неспособность разоружиться и двумя острокритическими намеками на военную экспансию, или что США послали ноту, которая может быть охарактеризована как вздорная по тону? В контент-анализе иногда – и всегда по недостатку средств – мы рискуем не увидеть леса за деревьями или , по аналогии, значение информации вообще за частями, ее составляющими. По этой причине мы должны быть очень и очень осторожными в выборе измеряемой единицы анализа и избрать наиболее перспективную и благоприятную для проведения исследования в целом. [c.277]

ПРОВЕДЕНИЕ СОДЕРЖАТЕЛЬНОГО КОНТЕНТ-АНАЛИЗА

Приняв решение о совокупности сообщений, выборке и единице анализа, мы можем приступать к самому анализу. Контент-анализ, основанный на исследовании слов, тем и сообщений, сосредоточивает внимание исследователя на содержании сообщения, на том, о чем в нем говорится. Таким образом, собираясь подвергнуть анализу эти элементы, мы должны уметь предвидеть их смысл и уметь определять каждое возможное наблюдение в соответствии с нашими ожиданиями.

На деле это означает, что в качестве первого шага при проведении контент-анализа этого типа мы должны создать своего рода словарь, в котором каждое наше наблюдение получит определение и будет отнесено к соответствующему классу. Допустим, например, нас интересует проблема идентификации в кубинских школьных учебниках [c.277] для 6-го класса всех упоминаний об американцах и США. Прежде чем приступать к анализу, мы должны определить, что же является в данном случае ключевым словом (словосочетанием). Должны ли мы обращать внимание только на слова “американец”, “американский” и “США”? Если да, то мы рискуем упустить из виду упоминания, состоящие из таких экспрессивно-оценочных терминов, как “агрессоры-янки”, “империалисты с Севера”, “гринго”, “захватчики”, “вторжение в Гуантанамо”, “беззаконный режим Вашингтона”. Более того, некоторые такие фразы могут употребляться в нескольких разных смыслах, из которых лишь один относится непосредственно к США. Рассмотрим следующие условия задач по арифметике:

1. Если кубинский народ владеет 1 тыс. акров пахотных земель, а неоколониалистские агрессоры отнимут у него 1 тыс. акров пахотных земель, то сколько акров пахотных земель останется кубинскому народу на пропитание?

2. Если африканцы владеют 1 тыс. акров пахотных земель, а неоколониалистские агрессоры отнимут у них 1 тыс. акров пахотных земель, то сколько акров пахотных земель останется африканцам на пропитание?

Допустим, что оба случая упоминания “неоколониалистских агрессоров” мы будем считать относящимися к США, тогда обе задачи будут восприняты нами как антиамериканские по смыслу. Однако тот, кто знаком с новейшей историей и идеологией Кубы, сочтет ключевым лишь первое из этих упоминаний, в то время как второе будет им интерпретировано скорее как выпад в адрес белого правительства ЮАР.

Проблема состоит в том, что мы должны предвидеть не только упоминания, которые нам могут встретиться, но и элементы их контекстуального употребления, а для этого мы должны разработать детальную систему правил оценки каждого случая употребления. Эта задача обычно решается посредством пилотажа подлежащей анализу совокупности сообщений (т.е. с помощью выявления на материале небольшой выборки сообщений тех типов ключевых упоминаний, которые с наибольшей вероятностью могут встретиться в последующем, более полном анализе) в сочетании с арбитражными оценками контекстов и способов употребления терминов. Здесь, как и в формальном [c.278] анализе, о котором речь пойдет ниже, предпочтительнее иметь дело с наблюдениями не одного, а нескольких исследователей.

==================================================================

Таблица 9.1

Образцы фраз из газетных передовиц в поддержку
некоторого кандидата (в случайном порядке)

Лучший из худших
Лучший из имеющихся
Лучше, чем его соперник
Наш главный избранник
Наилучший кандидат среди множества других
Кандидат, о каком можно только мечтать
Выдающийся деятель
Многообещающий деятель
Один из лучших сынов нации
Меньшее из двух зол
Лучшее из того, что мог бы дать процесс отбора
Наш неизменный любимец
Нужный сегодня человек
Приемлемый кандидат
Весьма приемлемый кандидат
Рекомендуем с рядом оговорок
Безоговорочно рекомендуем
Горячо поддерживаем
Искренне рекомендуем
Предлагаем свою поддержку
С радостью рекомендуем вашему вниманию
Призываем вас голосовать “за”

==================================================================

Более трудной является задача, заключающаяся в необходимости приписывания ключевым упоминаниям конкретных оценок, – когда мы должны решить, приводится ли данное упоминание в позитивном или негативном смысле, “за” или “против” интересующего нас объекта и т.д., а также когда нам надо ранжировать ряд упоминаний соответственно силе их оценок (т .е. в соответствии с тем, какое из них самое положительное, какое следующее за ним по положительности и т.д.). При этом мы нуждаемся в показателях достаточно тонких, которыми можно было бы измерять не только настроения политических субъектов, но и силу этих настроений. Ситуация подобного рода отражена в табл. 9.1, где в обобщенном виде перечислены возможные формы предвыборной поддержки газетой некоторой кандидатуры. Если целью является определить, какая из газет активнее всего поддерживает эту кандидатуру, то наша непосредственная задача будет [c.279] заключаться в том, чтобы решить, как следует ранжировать эти утверждения в соответствии с той силой поддержки, которую каждое из н их отражает.

Существует несколько методов, облетающих принятие такого решения. Два наиболее известных способа ранжирования – это метод Q-сортировки и шкалирование путем парного сравнения. Подобно методу шкалирования по Тёрстоуну, описанному в гл. 8, они опираются на суждения группы арбитров о значении или силе (интенсивности) некоторого термина с той только разницей, что здесь арбитры могут отбираться из числа как отправителей, так и получателей сообщения, как из группы ученых, хорошо знакомых с предметом изучения, так и из населения в целом, а также из числа самих исследователей. Оба эти метода отличаются друг от друга и от метода Тёрстоуна по тем задачам, которые они ставят перед арбитрами.

Q -сортировка в этом отношении ближе к методике Тёрстоуна. В этом методе используется шкала жесткого распределения (forced distribution scale) из девяти пунктов: пункт 1 соответствует минимальной степени интенсивности измеряемого признака (например, наименьшей степени одобрения), а пункт 9 – максимальной степени интенсивности (например, наивысшей степени одобрения). В отличие от методики Тёрстоуна в рамках данной шкалы не предусмотрено отражение нейтрального или антитетического (прямо противоположного) суждения или оценки. Цель здесь состоит в том, чтобы просто ранжировать (упорядочить) все суждения вдоль единой оценочной оси. Кроме того, при пользовании Q-шкалой арбитры связаны ограничениями сильнее, чем в методике Тёрстоуна. Арбитру дается определенная жесткая квота на каждую категорию шкалы (т.е. ожидаемое число слов или фраз, которые должны быть им отнесены к данной категории), а затем ему предлагается распределить заданный набор терминов так, чтобы установленные квоты не нарушались. Квоты основаны на предположении (не обязательно верном), что колебания в интенсивности слов и фраз должны укладываться в рамки нормального распределения (когда изучаемые случаи максимально скучены в средней части шкалы, а по мере продвижения к ее полюсам их число равномерно убывает). Арбитры, таким образом, вынуждены давать относительные оценки конкретным словам и фразам [c.280] (случаям), относя их к определенным категориям шкалы¹. Эта процедура отражена в табл. 9.2.

Таблица 9.2

Распределение случаев при Q-сортировке

Категория (значение)	1	2	3	4	5	6	7	8	9
Распределение (в процентном отношении)	5	8	12	16	18	16	12	8	5
Распределение (по числу случаев)	2	4	6	8	10	8	6	4	2

Таблица состоит из трех строк. В первой представлены значения (оценки), приданные каждой категории шкалы (от 1 до 9). Во второй отображено процентное распределение всех изучаемых случаев по девяти категориям. Эти числа суть квоты, из которых исходит каждый арбитр. Так, например, каждый арбитр должен 5% всех случаев отнести к категории 1, 8% всех случаев – к категории 2, 12% – к категории 3 и т.д. В третьей строке таблицы указано конкретное число случаев, определяемое данным процентным отношением для конкретной исследовательской проблемы. По исходному предположению табл. 9.2 каждому арбитру нужно ранжировать 50 слов или тем. Числа в строке 3, таким образом, представляют собой результаты вычисления процентных отношений, указанных в строке 2, от общего числа п = 50. Эти числа диктуют каждому арбитру, сколько случаев должно быть отнесено к каждой категории². При проведении Q-сортировки строки 1 и 2 остаются все время неизменными, а в строке 3 значения меняются в зависимости от числа случаев, подлежащих ранжировке.

После того как арбитры завершили свою работу, вычисляется средняя (арифметическая) оценка шкалы для каждого случая, а затем полученные средние оценки соответствующим образом ранжируются. (Логическое обоснование этого последнего шага то же, что и в случае использования статистики интервальной шкалы анализа данных, полученных методом шкалирования по Тёрстоуну.) Далее результаты этого ранжирования случаев по [c.281] интенсивности используются для приписывания анализируемым текстам кодов, обусловленных встречаемостью в них слов или тем, получивших нашу оценку. Произвольность оценки одного исследователя заменяется таким путем коллективной мудростью нескольких арбитров.

Шкалирование методом парного сравнения имеет те же цели, но техника его несколько иная. Каждый случай, подлежащий оценке, последовательно сравнивается попарно со всеми другими случаями, при этом каждый арбитр должен решить, какое из слов (или фраз) в каждой паре “сильнее” (или интенсивнее) другого. Так, если нам надо сравнить пять утверждений (случаев), то каждый арбитр будет последовательно сравнивать сначала 1-е из них со 2-м, с 3-м, 4-м, 5-м, потом 2-е с 3-м, 4-м, 5-м и т.д., всякий раз при этом отмечая, какое из двух более интенсивно. Подсчитав, сколько раз каждый случай оказался в оценке всех арбитров “сильнее” других, и разделив полученное число на число арбитров (т.е. вычислив среднюю оценку, вынесенную группой арбитров каждому утверждению), мы получаем возможность осуществить количественное ранжирование всех случаев по степени их интенсивности. Чем выше средняя оценка некоторого утверждения, тем оно, по мнению арбитров, “сильнее”.

С методами Q-сортировки и парного сравнения связаны по меньшей мере две сложности. Во-первых, в обоих этих случаях исследователь полагается полностью на решения арбитров, критерии оценки которых могут быть, а могут и не быть правомерными и/или состоятельными. В экспертизе такого рода стандарты не всегда ясны или, во всяком случае, не всегда ясно определены, и вследствие этого сами оценки носят дискуссионный характер. Действительно, не столь редки случаи, когда один и тот же арбитр выставляет различные оценки одному и тому же утверждению в серии идентичных испытаний. Поскольку мы здесь подвергаем выборочному обследованию не людей, а содержание сообщений, у нас нет четко обозначенной референтной группы населения, как при шкалировании по Тёрстоуну, и нет также набора имплицитных параметров, на которые можно было бы равняться. Другими словами, отбор арбитров в высшей степени произволен. Следовательно, и надежность результатов, полученных при опоре на таких арбитров, может быть минимальной. В [c.282] довершение ко всему эти оценочные методы могут оказаться весьма утомительными и громоздкими. Q-сортировка 100–200 случаев, требующая бесконечно повторяющейся идентификации мельчайших различий между ними, или же попарное сравнение 50 случаев, требующее рассмотрения 1225 различных пар (n[n–1]/2, где n – число случаев), может исчерпать терпение любого, сколь угодно прилежного арбитра. Поэтому к данным процедурам следует прибегать с осторожностью. [c.283]

ПРОВЕДЕНИЕ СТРУКТУРНОГО КОНТЕНТ-АНАЛИЗА

Помимо слов, тем и других элементов, обозначающих содержательную сторону сообщений, существуют и иные единицы, позволяющие проводить структурный контент-аналнз. В этом случае нас интересует не столько что говорится, сколько как говорится, и хотя мы не должны сильно отступать от предмета сообщения, но измеряем мы при этом нечто иное.

Нас может интересовать, например, сколько времени или печатного пространства уделено интересующему нас предмету в том или ином источнике. Сколько слов или газетных столбцов было уделено каждому из кандидатов во время определенной избирательной кампании? Сколько статей или страниц бывает ежегодно посвящено в американских политологических журналах анализу государственно-политических проблем Африки? Изменялось ли это количество за последние 30 лет или осталось неизменным?

С другой стороны, нас могут интересовать и другие, возможно, более тонкие вопросы, относящиеся к форме сообщения. Сопровождается ли конкретное газетное сообщение фотографией или какой-либо иллюстрацией? Ведь, как выяснилось, те, которые сопровождаются, привлекают больше читательского внимания. Каковы размеры заголовка данного газетного сообщения? Напечатано ли оно на первой полосе или же похоронено в ворохе реклам? При ответе на подобные вопросы нас интересуют не тонкости содержания, а способ презентации сообщения. Мы следим за фактом наличия или отсутствия материала по теме, за степенью его выделенности, за его размерами скорее, нежели за нюансами его содержания. В результате мы [c.293] зачастую получаем анализ с куда более надежными измерениями, чем в случае исследования, ориентированного на содержание (постольку, поскольку формальным показателям в меньшей степени присуща неоднозначность), но зато, как следствие, и куда менее значимый.

На рис. 9.1 представлен образец типичного кодировального бланка, используемого для записи данных в ходе структурного контент-анализа. Рисунок взят из работы, в которой исследовалось освещение в прессе выборов в конгресс³. За единицу анализа в ней был принят материал о кандидате (candidate insertion), определяемый как любое газетное сообщение, в котором поименно или имплицитно упоминались любые кандидаты в конгресс от того округа, где распространялась данная газета. Таким образом, каждая строка кодировочной таблицы суммарно отражает признаки одного такого материала о кандидате.

Рис. 9.1. Типичный кодировальный бланк для проведения структурного контент-анализа.

О приписывании каждому столбцу кодировального бланка определенного номера мы будем говорить ниже, в гл. 12, а пока укажем на тип регистрируемой информации. После того как каждому случаю придан индивидуальный регистрационный номер, он классифицируется по типу (информационное сообщение, передовица, очерк на данную тему, письмо в редакцию), указываются: дата его публикации; имя кандидата, к которому он относится; название газеты, где он опубликован; общие предпочтения, если таковые выражены в материале; степень его выделенности по расположению на площади газетного листа (напечатан на первой полосе, на вкладыше, в подвале); наличие [c.284] или отсутствие сопроводительных фотографий или рисунков; наличие упоминания о кандидате в заголовке материала; основное содержание материала (предвыборные новости, реферат речи, публикация в поддержку кандидата); общий объем материала и объем той его части, которая относится непосредственно к интересующему нас кандидату.

Надо заметить, что измерения такого рода весьма поверхностно затрагивают само содержание каждого сообщения в отличие от детального и внимательного обследования, необходимого при содержательном анализе. В результате структурный контент-анализ обычно более прост в разработке и проведении, а потому и более дешев и надежен, чем содержательный контент-анализ. И хотя его результаты, возможно, удовлетворят нас в меньшей степени – ибо они дают нам скорее набросок, чем законченную картину сообщения, – но при ответе на конкретный исследовательский вопрос они могут зачастую оказаться вполне адекватными. [c.285]

НЕКОТОРЫЕ ПРОБЛЕМЫ, ВОЗНИКАЮЩИЕ В ХОДЕ КОНТЕНТ-АНАЛИЗА

Хотя контент-анализ представляет собой относительно недорогой метод, опирающийся на доступные базы данных, и хотя при его проведении мы не рискуем столкнуться со сложностями и весьма специфическими этическими проблемами (кроме тех случаев, когда анализу подвергается конфиденциальная или засекреченная информация), нам все же надо проявлять определенную внимательность, чтобы избежать кое-каких трудностей, заключенных в этом методе.

Прежде всего необходимо учитывать, что сообщения публикуются и соответствующим образом составляются не просто так, а с какой-то определенной целью – с целью то ли информирования, то ли описания, то ли призыва, предписания, самозащиты или даже с целью дезинформации. Поэтому при анализе сообщений мы должны стараться интерпретировать их содержание не иначе, как в контексте их очевидных целей. Например, часто в китайской прессе можно встретить утверждения типа: “Весь китайский народ верит, что новая сельскохозяйственная политика является главным (коренным) шагом вперед на [c.285] пути к прогрессу и социальной революции”. Рассматриваемые по сути, они представляют собой очевидную демонстративную ложь, поскольку не может каждый из миллионов и миллионов человек осознавать какую-то одну установку (в данном случае мы не берем во внимание ее достоинства). С этой точки зрения мы бы должны были склониться к рассмотрению этих утверждений как наиболее вульгарной формы пропаганды. Однако из опыта изучения китайской прессы видно, что утверждения такого типа публикуются совсем не с целью чисто внешней иностранной пропаганды, но более всего предназначены для внушения самим китайцам веры в то, что их правительство хочет, чтобы они были сильными. Другими словами, такие утверждения о единодушии носят не описательный, но директивный характер. Знание этого позволит интерпретировать их скорее как удачный индикатор политических интересов китайских лидеров, нежели как бессмысленную и пустую пропаганду, и мы можем использовать их с некоторой выгодой для себя. Таким образом, цель, с которой информация вводится в оборот, сама по себе может рассмотрена как важный для понимания сути контекст, который мы должны попытаться по возможности вытащить.

Сходным образом и характер распространения того или иного сообщения может неявно выражать многое в его значении. Предвыборная листовка, распространяемая по списку адресов избирателей, является примером сообщений с ограниченной или особой сферой распространения. Даже общедоступная газета может иметь ограниченный или особый круг читателей. У “Нью-Йорк таймс”, например, читательская аудитория состоит из более состоятельных и образованных людей, чем у “Нью-Йорк дейли ньюс”, притом что обе газеты легкодоступны для всех. Журнал “Уолл-стрит джорнэл” можно купить везде в США, но круг его читателей охватывает далеко не все социально-экономические группы населения. Следовательно, если мы должны дать адекватную оценку значимости некоторого сообщения, нам зачастую надо при этом знать, кому оно адресуется и как распространяется. Опираясь то ли на чье-то индивидуальное мнение (например, на мнение хорошо осведомленных лиц), то ли на наведение справок, когда мы пытаемся узнать у отправителей сообщения список его получателей, толи на самоочевидные свидетельства, когда к документу прилагается список [c.286] всех ознакомившихся с ним лиц, иногда с их личными подписями, то ли на опрос читательской аудитории (типа тех, которые обычно проводят газеты, чтобы документально обосновать свои претензии по доставке), мы должны постараться измерить или оценить круг распространения сообщения. Эта информация позволит нам судить о значимости и о важности анализируемого нами материала.

Мы должны постараться правильно оценить степень доступности интересующих нас сообщений. Обеспечена ли нам возможность свободного отбора материалов для анализа? Доступны ли нам все материалы в неискаженном виде или же нам навязан некий контроль извне? Имеем ли мы доступ, например, только к рассекреченным документам (к газетам, издаваемым в расчете на иностранных читателей; к стенограммам только официальных заседаний правительственных комиссий)? Здесь мы имеем дело с проблемой обобщаемости результатов: вопрос в том, насколько репрезентативна исследуемая совокупность сообщений, не говоря уже о выборке из нее. Если совокупность непредставительна, то исследователь при отсутствии у него должной бдительности может быть, самое малое, введен в заблуждение, а то и хуже: может стать объектом сознательной манипуляции.

В каждом из этих случаев основная сложность заключается в том, что информация, необходимая для адекватной оценки, может быть нам просто недоступна. Мы можем не знать и не иметь возможности уточнить цели сообщений, сферу их распространения и реальную степень своего доступа к ним. За этим скрываются весьма многообразные опасности, и контент-аналитик должен быть наготове, чтобы вовремя с ними справиться. Нельзя строить свои оценки на первом впечатлении; напротив, надо сохранять здоровый скептицизм в отношении имеющихся данных, до тех пор пока не будут получены ответы на все обсуждавшиеся выше вопросы. Сказанное, конечное, не означает, что в условиях неопределенности проведение контент-анализа исключается; оно значит только, что, приступив к анализу, исследователь не должен забывать об этой неопределенности.

Наконец, следует сказать несколько слов о надежности интеркодирования. За исключением полностью компьютеризованных контент-аналитических процедур (существует [c.287] целый ряд программ, специально разработанных в расчете на составление словарей ключевых слов, а также на поиск в тексте и числовую обработку последних), контент-анализ целиком опирается на суждения совершенно определенного человека о содержании сообщения. В конце концов, информация сама себя не анализирует. Она изучается, обрабатывается, обсчитывается и классифицируется человеком в лице конкретного исследователя. При этом разные исследователи могут расходиться между собой в понимании данного сообщения. Однако измерения могут считаться достаточно надежными лишь тогда, когда относительно их содержания между исследователями достигнут определенный уровень консенсуса. Надежность интеркодирования – термин, используемый в политологии для описания степени такого консенсуса. Чем она выше, тем лучше. Повысить надежность интеркодирования можно с помощью следующих правил:

1. К операционализации любой переменной следует подходить с осторожностью и тщательностью. Удостоверьтесь в том, что все значения сформулированы ясно и по возможности недвусмысленно. На деле такая мера поможет формированию общих критериев оценки, которые можно будет последовательно использовать при классификации и измерении содержания.

2. Используйте услуги как можно большего числа наблюдателей (кодировщиков). Чем больше людей участвует в достижении консенсуса, тем он более значим. Конечно, это может привести к сильному увеличению объема работы (а в случае если наблюдатели плохо подготовлены, то и к риску увеличения ошибки измерения), но и отдача от этой меры может быть очень велика. Ограничивающим фактором здесь обычно выступает нехватка денежных средств.

3. Всячески способствуйте тому, чтобы наблюдатели как можно больше взаимодействовали между собой. Проводите совместные практические занятия с обязательным обсуждением всех нюансов в интерпретации данных; это приведет к достижению консенсуса не только в отношении самих данных, но и в отношении истинных значений операциональных определений.

Успех вышеприведенных мер может быть численно оценен двумя разными способами, связанными со [c.288] статистическими понятиями, которые мы подробнее обсудим в гл. 16. Один из этих способов, применяющийся главным образом в содержательном контент-анализе, состоит в том, что все наблюдатели, задействованные в данном проекте, независимо друг от друга анализируют и кодируют одно и то же сообщение (т.е. приписывают ему свои собственные числовые оценки), после чего вычисляется коэффициент корреляции (r Пирсона) кодов, выданных каждыми двумя наблюдателями. Этот коэффициент измеряет степень согласованности между собой принадлежащих разным наблюдателям оценок наличия и/или частоты встречаемости отдельных слов или тем. Значения коэффициента колеблются в диапазоне от –1 до +1, и показания от +0,9 и выше обычно свидетельствуют о высокой степени интерсубъективной надежности кодирования⁴.

Другой прием более подходит для структурного контент-анализа, при котором нас интересует не столько трактовка тем, сколько факт их наличия или отсутствия, и при котором дублирующие друг друга измерения не столь необходимы. В данном случае мы рассматриваем все расхождения между наблюдениями, принадлежащими разным наблюдателям, как самостоятельную переменную, в отношении которой имеет смысл задать вопрос, связана ли она с систематическими расхождениями значений любой другой измеренной нами переменной. Другими словами, нас занимает проблема: возможно ли, что один (или более) наблюдатель фиксировал результаты последовательно отличным от других наблюдателей образом? Если признать, что все случаи были распределены между наблюдателями без смещений (обычно особые усилия приходится приложить, чтобы распределить их случайным образам), то любые систематические расхождения, наблюдаемые нами, являются результатом скорее расхождений между кодировщиками, нежели глубинных расхождений между отдельными случаями, которые оказались приписанными ошибающемуся наблюдателю. Коэффициент надежности интеркодирования здесь принимает форму (1–η²), где η – мера рассеяния значений каждой зависимой переменной, обусловленная наличием расхождений между кодировщиками⁵. Вычтя эту “межнаблюдательскую ошибку” из 1, мы получаем долю наблюдений, свободных от ошибки. Данный коэффициент вычисляется [c.289] отдельно для каждой переменной, и, чтобы можно было рассчитывать на достаточную надежность измерений, должен превышать 0,9.

ВЫВОДЫ

Мы видим, что контент-анализ – это методика с широким спектром применения, с определенными преимуществами в виде дешевизны, небольшого объема выборки, доступности данных. Однако, возможно, более, чем любой другой метод, он требует тщательной операционализации всех переменных и постоянного мониторинга процесса Наблюдения. Благодаря ему можно получить высокоинформативные результаты, которые, однако, должны интерпретироваться лишь в контексте, подчас не достижимом средствами только контент-анализа. По этой причине этот метод используется чаще всего в сочетании с другими методами сбора данных (опросом, непосредственным наблюдением). [c.290]

10-лекция. ИСТОЧНИКИ И ПРИМЕНЕНИЕ СВОДНЫХ ДАННЫХ

Политолога не интересуют отдельные люди. Вернее, политолога (как ученого) интересуют отдельные индивиды лишь постольку, поскольку они являются составной частью изучаемой им группы людей. Например, мы можем изучать поведение какого-то конкретного губернатора, но не потому, что мы хотим узнать больше о губернаторе Смите, а потому, что, как нам кажется, из наблюдений над губернатором Смитом мы можем вынести лучшее представление об американских губернаторах вообще и можем научиться прогнозировать их поведение. Политолога интересует изучение групп или сообществ людей, таких, как совокупность американских избирателей, индийское крестьянство или российская бюрократия.

Иногда для изучения этих групп нам приходится собирать данные об их отдельных членах (или о репрезентативных выборках из них) и затем объединять, или сводить, эти данные, для того чтобы получить информацию о группе в целом. Однако зачастую совокупная информация о группе уже имеется. Данные, характеризующие группу или сообщество индивидов в совокупности, принято называть сводными данными.

Существует две основные разновидности сводных данных. Первая из них – это суммарные показатели, к которым относятся большие совокупности мер групповых признаков, получающиеся путем объединения данных о поведении всех членов группы. К сводным данным, к примеру, можно отнести население государства. Уровень рождаемости, смертности, грамотности, преступности – это все сводные показатели, получаемые посредством сложения всех соответствующих отдельных событий (смертей, рождений, преступлений и т д.) в группу и выражаемые в стандартизованных единицах (например, в расчете на тысячу человек населения). В каждом случае сводные данные отражают количество какого-то группового признака (или свойства), которым члены группы, будучи взятыми по [c.292] отдельности, не обладают. Индивид может выступать в качестве составной части населения, но не может быть самим населением. Индивиды могут рождаться, учиться, умирать, но не могут обладать коэффициентом рождаемости, грамотности, смертности в том же смысле, что и целое государство. Эти данные являются мерами совокупных признаков.

Ко второй основной разновидности сводных данных относятся те меры, которые отражают количество группового признака, выводимого не из объединения признаков отдельных членов группы, а из системных свойств группы. Такие меры часто называют системными показателями. Форма правления, например, – это системная переменная, и в любом государстве может быть установлена демократическая или недемократическая форма правления вне зависимости от того, какого поведения и каких взглядов – демократических или нет – придерживаются отдельные граждане этого государства. Точно так же бюджет любого округа в США может обнаруживать высокий уровень расходов на государственное образование вне зависимости от того, какое значение придают соответствующим проблемам отдельные жители этого округа.

Данные обеих указанных разновидностей, относящиеся к самым различным типам групп, можно получить из целого ряда источников. Группы можно разбить на две категории: территориальные группы (определяемые проживанием их членов в пределах определенного географического района, как-то: государства, города или переписного района) и демографические группы (определяемые личными признаками их членов, как, например, расовой принадлежностью или родом занятий).

Из этой главы вы узнаете, что использование сводных данных сопряжено с решением некоторых встающих при этом методологических проблем. Однако преимущества, получаемые от применения сводных данных, чаще всего сильно перевешивают возможные издержки. Использование сводных данных может быть сочтено необходимым или желательным тогда, когда индивидуальные данные (т.е. относящиеся к индивидуальным случаям) недоступны или слишком дорогостоящи. Можно привести следующие примеры. Если мы собираемся предпринять историческое исследование, то по крайней мере часть интересующих нас групп (например, население Чикаго в 1880 г.) [c.293] может принадлежать к числу уже умерших. Члены некоторых важных в политическом отношении групп (например, международных террористических организаций) могут упорно избегать интервьюирования и идентификации их личностей. Чаще, правда, политолог оказывается в ситуации, когда сбор индивидуальных данных теоретически возможен, но непомерно дорогостоящ. В особенности это относится к сравнительным исследованиям, поскольку расходы и организационные проблемы, связанные с проведением международного опроса, огромны.

Занимаясь вопросами, по которым индивидуальные данные почему-либо недоступны, политолог часто находит полезным использовать сводные данные, содержащие основную необходимую ему информацию. В настоящей главе читатель познакомится с тем, какие типы сводных данных являются доступными, какие бывают источники сводных данных, какие методологические проблемы встают при использовании сводных данных и, наконец, какие можно предложить общие правила сбора сводных данных. Читателю вскоре станет ясно, что правильное применение сводных данных требует мастерского владения методами сбора, обработки и анализа информации. Однако как студентам, так и профессиональным политологам приходится иметь дело чаще со сводными данными – в силу их большей доступности, – чем с любыми другими данными, получаемыми с помощью методов, описанных в предыдущих главах. [c.294]

ТИПЫ СВОДНЫХ ДАННЫХ

Большая часть доступных политологам сводных данных бывает, как правило, собрана не политологами и не в исследовательских целях. Поэтому они зачастую имеют лишь косвенное отношение к конкретному политологическому исследованию. На самом деле при анализе сводных данных сложнее всего бывает уметь использовать имеющиеся данные в качестве показателей тех понятий, которые непосредственно интересуют исследователя. Например, на первый взгляд почти нет оснований думать, что политолога может заинтересовать число купленных в стране радиоприемников или величина оформленной подписки на газеты. В конце концов политолог – это не агент по сбыту печатной продукции. И все же соответствующие [c.294] цифры могут оказаться для него полезными, выступая в качестве косвенных показателей уровня обмена политической информацией в обществе или уровня его экономического развития, что само по себе, безусловно, входит в сферу интересов политологии. Точно так же и сведения о числе больничных коек в расчете на тысячу человек населения обретают определенную политологическую значимость, если их рассматривать как показатели, допустим, эффективности государственной политики в области здравоохранения или степени доступности медицинских услуг для различных социальных слоев в рамках города или государства.

Суть в том, что сводные данные часто не представляют самостоятельного интереса; поэтому, чтобы быть примененными с пользой для исследования, они нуждаются в определенной обработке. Не следует ориентироваться только на уже готовые показатели, но нужно уметь увидеть возможность объединения кажущихся не связанными друг с другом мер в пригодные для данного исследования показатели.

Существует шесть типов сводных данных¹, приводимых ниже в порядке убывания их валидности и надежности.

1. Данные переписи (цензовые данные). Многие государства мира периодически предпринимают сплошные опросы всего населения (или, как минимум, всех семей), для того чтобы получить информацию, которую можно будет в дальнейшем использовать в целях регулирования налогообложения и планирования государственной политики. Среди прочего эта информация включает данные о количественном составе семьи, о половой принадлежности главы семьи, о времени проживания в данной местности, об уровне образования, о доходах семьи и о ее жилищных условиях. Хотя цензовые данные собираются по каждой семье индивидуально, но к тому времени, как они станут доступными исследователям в форме официальных учетных документов, они обретают вид суммарных итоговых цифр (например, общее число владельцев автомашин в некотором данном районе).

У цензовых данных есть целый ряд свойств, делающих их крайне ценными для политологического анализа. Во-первых, несмотря на то что в них встречаются ошибки², данные переписи бывают в целом вполне надежными. Во-вторых, [c.295] поскольку измеряемые переписью переменные обычно просты, ее данные принято рассматривать как высоковалидные. В-третьих, в некоторых государствах сбор относительно стандартизованных данных продолжается в течение многих лет. Таким образом, данные переписи дают возможность выявлять исторические тенденции и проверять гипотезы о различных изменениях во времени. В-четвертых, поскольку цензовые данные обычно носят стандартизованный характер (а именно содержат ответы на одинаковые вопросы и подразделяют ответы на одинаковые классификационные категории), они сравнимы между собой и поэтому бывают весьма полезны при сравнивании различных государств, городов или регионов. Вдобавок ко всему цензовые данные легкодоступны. Во многих странах публикуются итоговые отчеты как о всеобщей переписи населения, проводимой обыкновенно раз в десять лет, так и о различного рода специализированных опросах, проводимых в промежутках между всеобщими переписями. ООН раз в год публикует “Демографический ежегодник”, где приводятся данные переписей в разных странах. В США имеется Бюро переписей – большой отдел обслуживания исследователей, который помогает найти и получить для работы нужные данные из тех, что имеются в распоряжении бюро.

2. Ведомственная статистика. В каждом государстве различные органы государственного управления, предприятия, профсоюзы и другие общественные организации занимаются сбором информации, связанной с их собственной деятельностью. Если эти данные удовлетворяют запросам конкретного социологического исследовательского проекта, они могут принести большую пользу исследованию.

Некоторые организации собирают данные самостоятельно, как это делают, например, международные корпорации, ведущие учет своих капиталовложений, больницы, регистрирующие сведения о пациентах, и городские управления, ведущие в целях налогообложения учет недвижимого имущества. Есть организации, которые используют данные, добытые другими агентствами (такими, как министерство торговли США), для преобразования их в форму различных индексов, отражающих, например, экономическое развитие или демографические сдвиги. В [c.296] США к такому типу организаций относятся Комиссия по вопросам экономического развития и Международная ассоциация городских руководителей.

У исследователя, желающего ознакомиться с ведомственной статистикой, могут возникнуть определенные проблемы. Первой и, наверное, самой важной является проблема получения доступа к информации. Данные, собираемые государственными учреждениями, являются обычно частью государственной статистики и легкодоступны, но данные, которые собираются неправительственными организациями, находятся в частной собственности последних. Некоторые организации – особенно это относится к частным компаниям – считают свои данные секретными и очень неохотно делятся ими. Зачастую проблема состоит даже не столько в том, чтобы добраться до информации, сколько в том, чтобы просто узнать о ее существовании. Ведь никаких централизованных списков статистических данных не существует, поскольку они собираются тысячами самых разных государственных и частных организаций, вовлеченных в деятельность по учету информации. Исследователь может упустить из виду массу важнейших данных в силу простого недостатка сведений о существовании или о содержании конкретной статистики.

Проблема состоит в том, что содержание и качество данных могут сильно варьировать, затрудняя возможность их сравнения и обобщения. Если профсоюзы учителей штатов Индиана и Огайо собирают о своих членах почти несравнимые данные, то и мы не можем использовать эту статистику для осмысленного сравнения этих профсоюзов. Если мы к тому же не знаем, как собиралась информация, то мы и не можем знать, до какой степени надежны приводимые цифры.

И наконец, данные могут находиться в неудобной для обработки форме. Бывает, что статистика естественного движения населения какого-то конкретного района (данные о рождениях, смертях, заключении и расторжении браков и пр.) будет доступна только в несведенной форме и только в центральном населенном пункте этого района, так что исследователю придется много часов провести в здании местного управления, занимаясь утомительным [c.297] переписыванием данных от руки, с тем чтобы их впоследствии можно было ввести в машину и подытожить.

Вышеуказанные проблемы возникают не всегда, и, даже когда исследователю приходится сталкиваться с ними, все равно потенциальная отдача от использования сводной информации обычно стоит тех усилий, которые были приложены для их решения.

3. Выборочные опросы. Опросное исследование предполагает сбор данных на индивидуальном уровне. В тех случаях, когда опросы основываются на выборках, репрезентативно отражающих интересующую нас группу населения, их результаты могут быть использованы нами в качестве сводных данных. Например, мы хотим сравнить уровни политической информированности граждан двух разных государств. Если в каждом из этих государств имеется своя служба изучения общественного мнения, которая регулярно проводит выборочные опросы населения (так, как это делают институты Гэллапа и Роупера в США), включая вопросы о таких поведенческих признаках, как величина подписки на общественно-политические журналы или время, потраченное на просмотр информационных телепрограмм, то результаты этих опросов мы можем применить для построения сводных мер нашей переменной. Подобным же образом иногда можно использовать результаты опросов, проводимых в академических целях³. Преимуществом опросных данных – если они грамотно собраны – является высокий уровень надежности и валидности, причем степень последней зависит от умения исследователя выводить новые показатели. Опросные данные тоже в целом доступны (во всяком случае, за определенную плату их можно получить у тех организаций или ученых, которые занимались их сбором), притом зачастую в удобной для использования форме.

4. Содержание публикаций. Для получения сводных данных можно предпринять и контент-анализ публикаций, финансируемых какой-то определенной организацией или распространяемых среди ее членов. Например, если мы изучаем процесс политизации населения Великобритании, то можно подвергнуть контент-анализу английские учебники по гражданскому праву на предмет определения того, какое внимание уделяется в них демократическим ценностям, и объединенные результаты такого анализа затем использовать в качестве единого показателя демократических ориентации населения страны. Точно [c.298] так же для получения показателя, отражающего соотношение интереса жителей развивающихся стран к международным делам и ко внутренней политике (или соотношение их симпатий к странам советского блока и к странам западного блока), мы могли бы прибегнуть к контент-анализу основных газет этих стран. И в том и в другом случаях результатом контент-анализа будет показатель определенного группового признака.

Сводные данные этого типа собираются исследователем специально для целей конкретного исследовательского проекта в отличие от тех, что берутся в готовом виде из какого-либо первичного источника, как, например, из отчета о результатах переписи. В силу этого доступность таких данных зависит от доступности необходимых публикаций и от того, располагает ли исследователь средствами для проведения контент-анализа. Надежность и валидность этих данных будут зависеть от умения исследователя правильно применять правила, описанные в гл.9. Сводные данные, собранные посредством контент-анализа публикаций, имеют то преимущество, что они могут быть пригодными для любого исследования, но получаемые с их помощью показатели базовых понятий бывают обычно весьма несовершенными. Ведь не очень ясно, насколько, например, можно быть уверенным в состоятельности утверждений о политических ценностях английских школьников, полученных на основе анализа учебников гражданского права.

5. Событийная информация. Политолога зачастую интересует такая информация об отдельных событиях, которая не отражается ни в отчетах о результатах переписи, ни в ведомственной статистике ввиду того, что эти события либо слишком редки, либо вообще выпадают из поля зрения статистики. Примерами событий такого рода могут служить восстания, революции, убийства, разрыв дипломатических отношений, привлечение государственных должностных лиц к суду за служебные злоупотребления, государственные перевороты и создание новых политических партий. Информация о таких событиях может оказаться полезной при построении показателей каких-либо групповых свойств. Например, уровень политической стабильности в стране можно было бы измерить путем подсчета числа актов политического насилия, имевших [c.299] место в течение определенного периода времени, а уровень политической коррупции в крупных городах – через подсчет числа случаев привлечения государственных чиновников к суду за взяточничество.

Процесс сбора событийной информации очень напоминает контент-анализ. После того как мы решим, какие события важны для нашего исследования, и тщательно их операционализируем (например, решим для себя, из каких действий состоит восстание), мы приступаем к систематическому обследованию всех источников (газет, ежегодников, записей радиопередач), в которых может содержаться информация об этих событиях, после чего подводим итог (следя при этом за тем, чтобы не посчитать одно и то же событие дважды, в том случае если оно упомянуто более чем в одном источнике). Кроме того, для получения более детализированной информации мы можем воспользоваться техникой контент-анализа. Например, для определения того, насколько серьезны общественные беспорядки, их можно классифицировать либо по продолжительности, либо по размерам примененного насилия, либо по числу участников.

Относительная надежность событийной информации может быть обеспечена за счет тщательной подготовки исследователя и благодаря контролю со стороны тех, кто регулярно читает источники. Однако сделать эту информацию валидной чрезвычайно трудно. Главная проблема заключается в полноте отчетности. Даже если исследователь просмотрел все известные источники или отчеты о каком-либо типе событий, все равно нельзя поручиться, что ни одно имевшее место событие подобного рода не избежало регистрации. Есть страны, в которых правительство строго контролирует сообщения о политических событиях, с тем чтобы огласку получала только предпочтительная, с точки зрения этого правительства, информация, поэтому о многих важных акциях (вроде применения войск для подавления забастовки) может не появиться никаких сообщений и, следовательно, никакой валидной меры, этих событий построить нельзя.

Вторая проблема проистекает из первой и связана с тем, что в сообщениях возможны неточности. Даже когда о событиях имеется какая-то информация, детали этой информации могут оказаться намеренно или ненамеренно [c.300] искаженными, эти проблемы, конечно, преодолимы, однако, планируя исследование с привлечением событийной информации, о них следует помнить и реалистически оценивать возможности построения таким путем валидных мер⁴.

6. Экспертные данные. Бывают случаи, когда данных, нужных для построения мер каких-то определенных совокупных свойств, просто не существует. В этих случаях исследователь может иногда прибегнуть к использованию суждений экспертов или лиц, знакомых с предметом исследования.

Рассмотрим пример исследования, предметом которого является лоббистская борьба нескольких заинтересованных групп в защиту и против природоохранного законодательства. По данному вопросу может не существовать никаких официальных документов, но исследователь вполне может расспросить ведущих законодателей о том, какая группа и сколь интенсивно, по их оценке, поддерживает это законодательство или противодействует ему в своей лоббистской деятельности. Точно так же, если исследователь не в состоянии собрать данные о том, насколько широко тот или иной государственный режим прибегает к насилию, чтобы удержаться у власти, он может обратиться к ученым, которые бывали в соответствующих странах и знакомы с их политическими системами, с просьбой дать оценку соответствующих режимов.

Экспертные данные очевидным образом страдают определенными недостатками. Прежде всего, степень точности таких данных ограничена рамками личного опыта экспертов. Чтобы не полагаться на неверные или ограниченные оценки, можно прибегнуть к помощи нескольких экспертов, сверяя их показания между собой. Однако зачастую трудно найти сразу несколько квалифицированных экспертов, которые бы отличались друг от друга уровнем подготовки и опытом знакомства с предметом исследования, так что даже привлечение целой группы экспертов не может подчас служить гарантией точности данных. Во-вторых, даже тогда, когда информация, полученная от эксперта, абсолютно достоверна, она носит в целом весьма размытый характер. Ведь в конце концов исследователь интересуется впечатлениями и мнением эксперта о сложных явлениях, а не о числе отдельных событий. Тем не [c.301] менее указанные ограничения не должны обескураживать исследователя. Важно, чтобы он помнил о них, планируя исследование и анализируя экспертные данные, ибо ошибочно было бы обращаться с этими данными как с более надежной и точной информацией, чем это есть на самом деле. [c.302]

ПРОБЛЕМЫ, СВЯЗАННЫЕ С ИСПОЛЬЗОВАНИЕМ СВОДНЫХ ДАННЫХ

Из предшествующего изложения видно, что специфические проблемы, встающие при анализе сводных данных, меняются в зависимости от типов и источников этих данных. Существуют, однако, некоторые общие проблемы, с которыми всегда приходится сталкиваться при использовании сводных данных. Мы рассмотрим две такие проблемы, не ставя перед собой цели предложить готовые их решения, но желая предупредить исследователя о необходимости не упускать их из поля зрения.

Обсудим сначала так называемую проблему экологической ошибки, которую необходимо учитывать при составлении плана исследования и при спецификации и операционализации переменных, равно как и собственно при принятии решения об использовании сводных данных применительно к конкретному исследовательскому вопросу.

Исследователь рискует совершить одну из нескольких экологических ошибок всякий раз, как он пытается, основываясь на данных, собранных на одном уровне анализа, обобщить результаты на другой уровень анализа. Например, если мы, собирая данные о расовой принадлежности получателей государственного социального пособия в разных штатах США, обнаружим наличие сильной прямой зависимости между получением регулярной помощи от государства и принадлежностью к небелому населению, у нас может возникнуть искушение распространить этот результат на более высокий, т.е. общенациональный, уровень и объявить, что эта зависимость верна для данного государства в целом, либо, наоборот, обобщить “вниз”, допустив, что зависимость, обнаруживаемая в каждом отдельном штате, будет также верна и для каждого из его округов. Если же сведением данных мы занимаемся на общенациональном или окружном уровне, то, возможно – а по сути дела, почти наверняка, – мы обнаружим, что на [c.302] этих уровнях наблюдается зависимость, сильно отличная от той, которая была получена на основе данных, сведенных на уровне штата. Эмпирическое изучение “экологической” проблемы показало, что зависимости на разных уровнях могут быть не просто слабее или сильнее, но они могут быть даже разнонаправленными⁵. Когда исследователь экстраполирует результаты одного уровня анализа на другой, он рискует неверно проинтерпретировать свои данные и прийти к ошибочным выводам.

Значит ли это, что мы должны использовать только те данные, которые были сведены на уровне единиц анализа, изначально выбранных нами для изучения, и что мы в своем исследовании совсем не можем обобщать “вверх” или “вниз”? Нет, это не так. Существуют методы анализа данных, которые при определенных условиях помогают по меньшей мере свести к минимуму тот риск, с которым бывают связаны межуровневые обобщения⁶. Когда исследователь видит, что он волей обстоятельств вынужден использовать данные, сведенные не на том уровне анализа, с которым он имеет дело, а на другом, то, прежде чем собирать данные, он должен предусмотреть применение одного или нескольких таких методов и проследить, чтобы имеющиеся у него данные отвечали их требованиям.

Наверное, еще важнее проявлять бдительность – памятуя о риске “экологических” заключений – при планировании исследования и операционализации понятий. Здесь надо по возможности избегать применения показателей, требующих обобщения результатов разных уровней анализа. Пусть, например, задачей нашего исследования является определение зависимости между членством в профсоюзе и поддержкой демократической партии (в США), и в нашем распоряжении оказываются сводные данные по избирательным округам, где указано, какой процент избирателей каждого округа голосовал на последних выборах за демократов и какой процент трудящихся каждого округа состоит в профсоюзе. Мы сможем использовать эти данные только в том случае, если единицей нашего анализа являются избирательные округа, а целью анализа – суждения типа: “Чем больше в округе членов профсоюзов, тем больше вероятность, что на выборах в нем победит кандидат от демократов”. Однако если единицей анализа у нас выступают отдельные избиратели [c.303] (индивиды), то мы будем стремиться к получению суждений типа: “Члены профсоюзов, как правило, голосуют за кандидатов от демократов”. При этом мы не можем сколь-нибудь уверенно использовать сводные данные по избирательным округам, и будет разумнее, если мы попытаемся поискать данные, относящиеся к членству в профсоюзе и поведению на выборах отдельных индивидов.

Вторая (близкая первой) группа проблем, часто встречающихся при анализе сводных данных, связана с трудностями построения на основе сводных данных валидных показателей. Редко когда случается обнаружить сводные цифры, которые можно было бы использовать в качестве непосредственной меры какого-либо интересного для политолога понятия. Чаще всего мы имеем дело с числами, представляющими такие переменные, которые можно рассматривать как часть какого-то более крупного явления, с которым связаны наши базовые понятия. При изучении политических последствий научно-технического прогресса, например, исследователю, возможно, не удастся найти сводных данных, непосредственно отражающих уровень научно-технического прогресса в различных странах. Но он, наверное, сможет получить информацию о том, какая часть населения каждой страны грамотна, или живет в населенных пунктах численностью свыше 25 тыс. человек, или занята в несельскохозяйственных отраслях экономики; все эти параметры могут рассматриваться как составляющие научно-технического прогресса. Подобные цифры часто называют необработанными (“сырыми”) данными; они интересуют исследователя не сами по себе, а как основа для создания важных в рамках конкретного исследования понятий.

Перед исследователем стоит задача найти поддающиеся теоретическому и методологическому обоснованию пути превращения необработанных данных в пригодные для использования меры. Существует два основных подхода к этому – через формирование индексов и через преобразование данных.

Построение индекса заключается в сведении сложных данных в единый показатель, который отражает значение понятия полнее, чем любой из его компонентов. Широко используются три типа индексов – аддитивные, мультипликативные и взвешенные. Аддитивный индекс употребим [c.304] в тех случаях, когда доступные исследователю данные отражают различные меры одной и той же базовой переменной. Например, для получения показателя понятия “размеры экспорта сельскохозяйственной продукции” мы могли бы просто сложить все отчетные цифры, отражающие количество экспортированной пшеницы, кукурузы и соевых бобов (в бушелях); для выяснения размеров “религиозного сообщества” в некоторой стране можно было бы просуммировать все числовые данные, отражающие количество приверженцев различных религий, исповедуемых в этой стране.

Часто, однако, сводные данные отражают меры различных сторон некоторого явления, что не допускает возможности суммирования. Следуя законам математической логики, мы не можем, например, складывать число людей, участвовавших в беспорядках, с числом часов, в течение которых длились эти беспорядки, в надежде тем самым построить индекс степени серьезности беспорядков. Число участников и продолжительность являются неаддитивными элементами явления под названием “беспорядки”. Можно, однако, утверждать, что эти два элемента взаимодействуют друг с другом, и тогда для получения показателя степени серьезности беспорядков мы могли бы число участников умножить на число часов, вычислив таким образом число “человеко-часов”, пришедшихся на беспорядки. Полученный таким путем показатель называется мультипликативным индексом. Подобные индексы бывают нужны в тех случаях, когда мы измеряем различные аспекты некоторого понятия⁷.

При определенных обстоятельствах необработанные данные – для того чтобы стать обоснованным показателем понятий – нуждаются во взвешивании с помощью некоторого эталона. Например, использование числа участников антиправительственной манифестации в качестве показателя величины кредита доверия к правительству правомерно только тогда, когда это число выражено в форме процентного отношения к численности всего населения. Чтобы получить взвешенный индекс, мы должны одну переменную (число участников антиправительственных манифестаций) взвесить с помощью другой (численности населения). Точно так же, исходя из предположения, что десять демонстраций в год указывают на [c.305] большую политическую нестабильность, чем те же десять демонстраций, но растянутые на десять лет, мы могли бы число антиправительственных демонстраций взвесить с помощью эталонной переменной “время”, получив индекс количества демонстраций в год. Этот конкретный тип взвешивания называется стандартизацией.

Взвешивание – технически простая операция, но с концептуальной стороны зачастую бывает трудно определить, нуждается ли конкретная мера во взвешивании и что следует выбрать в качестве эталона веса. Неясно, к примеру, что выступает в роли спускового крючка гонки вооружений: абсолютные уровни вооружений вовлеченных в гонку государств или определенное соотношение этих уровней? Следует ли в качестве эталона веса использовать уровень вооружений государства-противника? Ответы на подобные вопросы обычно можно получить посредством эмпирического выяснения того, как именно применение взвешенных и невзвешенных показателей влияет на результаты статистического анализа.

Случается, что при использовании сводных данных исследователь сталкивается с такими мерами, которые невозможно сделать пригодными для целей конкретного исследования путем простого сочетания с другими мерами и их необходимо видоизменить в индивидуальном порядке. Иногда даже индексы после их видоизменения становятся более пригодными. Такие видоизменения обычно называются преобразованиями данных. Данные преобразуются главным образом для того, чтобы они отвечали требованиям определенных статистических процедур, которые исследователь намеревается применять в процессе анализа. Самым общим основанием для преобразования данных является необходимость избежать такого искажения результатов статистического анализа, которое бывает обусловлено определенными свойствами распределения необработанных данных.

Существует много методов преобразования данных, и каждый из них рассчитан на исправление вполне определенных изъянов, имеющихся у необработанных данных⁸. Однако логарифмическое преобразование может, пожалуй, служить хорошим общим примером того, как работают эти методы. Некоторые из наиболее часто используемых статистических процедур могут быть законно применены [c.306] только к данным с нормальным распределением (о нормальном распределении см. гл.15). Применение этих процедур к данным, не характеризующимся нормальным распределением, может привести к серьезной недооценке силы зависимостей, существующих между переменными, и к другим неверным выводам. Но необработанные сводные данные чаще всего не отличаются нормальным распределением. Логарифмические преобразования рассчитаны как раз на то, чтобы как можно более приблизить данные к нормальному распределению. Основная процедура состоит в том, что к “оценке” каждого случая в рамках множества необработанных данных прибавляется некоторая константа, после чего исходная оценка заменяется на подходящий логарифм с использованием логарифмической таблицы. Итог такого преобразования виден на рис.10.1, где показаны результаты преобразования гипотетических данных о числе людей, принявших участие в демонстрациях в защиту прав гомосексуалистов в 57 городах США. Распределение преобразованных данных (см. рис. рис.10.1б) не образует нормальной, или колоколообразной, кривой, но оно гораздо ближе к ней, чем распределение необработанных данных (см. рис. рис.10.1а).

Сказанное выше не следует интерпретировать в том смысле, что иметь дело сразу с несколькими мерами нежелательно. Наоборот, иметь множественные показатели (multiple indicators) понятий весьма желательно; при этом зачастую полезно как объединять разные меры в индексы, так [c.307] и изучать их на каком-то этапе анализа данных отдельно друг от друга. Это мотивируется тем, что использование множественных показателей позволяет контролировать степень обоснованности нашей операционализации понятий.

Пусть, например, мы хотим измерить понятие “дискриминация по признаку пола в сфере занятости” применительно к разным американским штатам. Допустим, нам удалось раздобыть данные по следующим переменным:

(1) соотношение средней заработной платы мужчин и женщин;
(2) доля женщин среди работников квалифицированного труда;
(3) соотношение уровней безработицы среди мужского и среди женского населения.

Мы можем использовать все три показателя, приписав каждому штату оценку (ранг) в рамках каждой переменной, а затем сравнив полученные результаты. Если те штаты, в которых выявляется наибольшая степень дискриминации по одному показателю, заняли высокий ранг и по другим показателям, то у нас есть все основания полагать, что каждый из этих показателей является валидной мерой базового понятия “дискриминация по признаку пола в сфере занятости”. С другой стороны, если мы обнаружим, что штаты, занявшие высокий ранг по двум каким-то показателям, по третьему из показателей имеют низкий ранг, то нам придется воздержаться от дальнейшего использования этого последнего девиантного показателя в качестве меры нашего базового понятия.

Чем больше независимых показателей удается выделить для каждого понятия, тем лучше, потому что большее количество показателей позволяет осуществить более основательную проверку валидности каждого из них. Так, в отношении предыдущего примера, где были выделены всего три меры, мы не можем быть совершенно уверены в том, что “девиантная” мера не является на самом деле валидной, а две другие, наоборот, лишенными валидности. Возможно, именно в силу своей валидности эта мера отклоняется от других показателей в том, как они ранжируют штаты. Если бы, однако, у нас было пять или десять мер, которые бы вполне непротиворечиво ранжировали штаты, наряду с одной стоящей в стороне от них мерой, то мы бы могли быть совершенно уверены в том, что валидности [c.308] лишена именно эта девиантная мера, а не остальные. Существует целый ряд методов, использующих множественные меры для проверки и усиления валидности показателей⁹.

Существует еще один очень важный вопрос, о котором необходимо помнить при использовании сводных данных. Он связан с тем фактом, что сводные данные доступны подчас только в форме, не позволяющей делать состоятельных сравнений между единицами. Так, например, если нас интересует, какое внимание уделяется в различных американских штатах вопросам народного образования, то нам следовало бы поискать данные о величине ежегодных расходов каждого штата на народное образование. Было бы, однако, некорректно сравнивать общую сумму денег, расходуемых Техасом, с общей суммой, расходуемой Род-Айлендом, ввиду того что эти штаты несопоставимы по размерам и благосостоянию. Род-Айленд может расходовать только малую долю того, что расходует Техас, и при этом демонстрировать большую степень заботы о народном образовании, благодаря тому что здесь на школы будет тратиться намного больше в расчете на каждого ребенка школьного возраста или относительно объема всего бюджета штата. Чтобы сравнить бюджеты штатов, нужно перевести данные об их расходах на образование в такую форму, которая бы учитывала имеющиеся между ними различия в численности населения и в величине бюджета. Если мы этого не сделаем, то у нас не будет валидного показателя базового понятия и наши выводы будут отражать не столько относительную величину заботы каждого штата о народном образовании, сколько его относительные размеры и благосостояние.

Подобные ситуации вынуждают нас каким-то образом стандартизовать наши меры. Мера является стандартизованной, когда она сформулирована так, чтобы в ней учитывались возможные расхождения между отдельными случаями в рамках переменных, отличных от той, которую она отображает. Очень часто бывает необходимо стандартизовать сводные данные перед тем, как приступать к сравнению единиц анализа. Это может повлечь за собой необходимость сбора данных по переменным, не имеющим прямого отношения к данному исследованию. Так, возвращаясь к предыдущему примеру, нам могут [c.309] понадобиться данные по численности населения и общей величине расходов штатов, чтобы с их помощью можно было стандартизовать расходы штатов на образование, выразив их в количестве долларов, приходящихся на обучение каждого ребенка школьного возраста, или в форме процентного отношения ко всему бюджету штата.

Точно так же, если бы мы захотели измерить понятие “милитаризация”, опираясь на цифры военных расходов различных государств, то, прежде чем делать какие бы то ни было сравнения, нам нужно было бы стандартизовать эту меру, выразив ее в форме процентного отношения к валовому национальному продукту (общая стоимость всех товаров и услуг, произведенных в данной стране за определенный период). Не сделай мы этого, и богатое государство будет выглядеть большим милитаристом, чем бедное, даже если оно расходует на военные цели относительно общей суммы своих доходов в десять раз меньше, чем бедное государство.

Итак, всякий раз, как вы собираетесь сравнивать какие-нибудь группы (страны, города, организации и т.п.), вам надо помнить о необходимости стандартизовать ваши меры и запланировать сбор дополнительных данных, которые могут понадобиться для стандартизации. Стандартизация обычно заключается в приведении меры к выражению вида “такое-то количество единиц в расчете на единицу какой-то другой переменной” или к форме процентного отношения к какой-то другой переменной. Это зачастую предполагает вычисление некоторого коэффициента, или уровня, как-то: уровень преступности (количество преступлений на тысячу человек населения), уровень грамотности (количество грамотных на тысячу человек населения), уровень детской смертности (количество детских смертей на тысячу рождений) и т.п. Дополнительная работа по сбору данных по тем переменным, с помощью которых должна быть стандартизована ключевая переменная, совершенно необходима, если стремиться к обоснованности сравнений между теоретически сильно различающимися случаями.

Итак, при анализе сводных данных исследователь должен не только проявлять осторожность в использовании необработанных данных в качестве показателей понятий, но и помнить о пользе множественных мер, а также о [c.310] возможности усовершенствования показателей посредством их сочетания, преобразования или стандартизации. [c.311]

ИСТОЧНИКИ СВОДНЫХ ДАННЫХ

Количество имеющихся в мире сводных данных так велико, что начинает казаться, что для каждого эмпирически полезного понятия могут найтись свои показатели. Изобилие данных иногда само по себе представляет проблему для исследователя, когда тот вынужден просматривать сотни источников в поисках всех существующих показателей. И в то же время при всем многообразии имеющихся данных исследователь бывает часто не в состоянии найти показатели, относящиеся именно к тому понятию, которое он хочет измерить, именно к нужному ему периоду времени и сведенные именно на нужном ему уровне анализа.

Мы не можем перечислять все источники сводных данных¹⁰. Но мы упомянем те источники данных общего характера, которые скорее всего могут понадобиться политологу. Хотя некоторые источники включают в себя данные по целому ряду проблем и поэтому не могут быть охарактеризованы как содержащие какой-то один конкретный тип данных, мы сгруппировали перечисляемые ниже источники в соответствии с тем, какой основной тип данных в них отражен.

Ключ к успешной работе с любыми документами и архивами данных лежит в точном знании того, какой тип показателей вы ищете. В уяснении этого вам может помочь испытываемая вами гипотеза, разрабатываемая теория или точная формулировка вашего исследовательского вопроса, благодаря которой вы лучше поймете, какой тип данных (например, общенациональный показатель производительности труда или размеры вооруженных сил страны) необходим для операционализации применяемых в вашем исследовании понятий. Если вы отправляетесь в библиотеку с намерением просто полистать доступные источники и, возможно, натолкнуться на какие-то полезные показатели, то вас почти наверняка постигнет самая горькая и абсолютно заслуженная неудача. Если же вы идете туда, имея в голове ясно продуманный план исследования, то вы по крайней мере будете в состоянии объяснить библиографу или работнику справочного отдела, что вам нужно. [c.311]

1. Демографические и связанные с ними данные по США. Вся статистика, публикуемая службами федерального правительства, находит отражение в “Американском статистическом указателе” (“American Statistical Index”), который можно использовать для установления того, какие имеются источники по конкретным показателям. Кроме того, публикации Бюро переписей отражаются в “Каталоге публикаций итогов переписей в США” (“Catalog of the United States Census Publications”), где описаны данные переписей жилищного фонда, населения, правительственных учреждений, сельского хозяйства и пр. Большая часть этих данных суммируется в издании “Статистическая сводка по США” (“Statistical Abstract of the United States”), которое содержит избранные статистические очерки по США в целом и по отдельным регионам страны, а также обширный указатель государственных и частных источников данных. Итоги каждой переписи в США в сжатом виде приводятся в издании “Subject and U.S. Area Reports”. В издании “Каталог Бюро переписей” (“The Bureau of the Census Catalog”) описываются все материалы, находящиеся в распоряжении Бюро переписей (опубликованные и неопубликованные). Это издание содержит географический и предметный указатели и выходит ежеквартально.

Из специализированных источников наиболее широко используются “Справочник по избирательным округам США” (“Congressional District Data Book”), где приводится демографическая и экономическая информация, а также результаты голосования в различных избирательных округах США, и “Справочник по округам и городам США” (“County & City Data Book”), содержащий ежегодные демографические и экономические данные по отдельным штатам, округам, городам и городским поселениям с населением свыше 25 тыс. человек. Сходные сведения имеются и в “Справочнике по отдельным штатам и столичному району” (“The State and Metropolitan Area Data Book”), издаваемом Бюро переписей. Данные голосования в сжатом виде публикуются в “Справочнике по выборам в США” (“Guide to U.S. Elections”), где даются сведения о результатах выборов президентов, губернаторов штатов и депутатов сената и палаты представителей (начиная с 1824 г.), и в издании “Америка голосует” (“America Votes”), [c.312] освещающем результаты всеобщих и первичных выборов (с 1952 г.).

2. Демографические и связанные с ними данные по другим странам. Сознавая все трудности, возникающие при поиске сравнимых данных по практически любой переменной, некоторые исследователи взяли на себя труд составления справочных пособий, в которых приводятся сведения по общенациональным показателям, представляющим наибольший интерес для политолога. Особой популярностью пользуются следующие три справочника:

1. Тауlоr Ch. L., Jоdiсе D.A. (eds.). World Handbook of Political and Social Indicators. – New Haven: Yale Univ. Press, 1983. Здесь представлены показатели почти по всем странам мира, отражающие как демографические, так и политические особенности отдельных государств (например, форму и степень стабильности государственного режима и пр.);

2. Rummеl R.J. Dimensions of Nations. – New Haven: Yale Univ. Press, 1971. Данное издание представляет собой исследование 82 стран мира по 236 показателям демографических, экономических и политических признаков;

3. Вanks A.S. Cross-Polity Time-Series Data. – Cambridge (Mass.): MIT Press, 1971. Содержит сведения исторического характера по 102 политическим, экономическим и демографическим признакам для 155 государств.

Существуют также и другие подобные издания.

Имеется, кроме того, целый ряд источников, в которых содержатся данные, собираемые различными международными организациями и государствами. Исследователь, обращающийся к таким источникам, должен быть особенно внимателен в отношении сравнимости приводимых в них цифр. Статистическое бюро ООН, Отдел экономических и социальных проблем (UN Statistical Office, Department of Economical and Social Affairs), регулярно публикует три в высшей степени полезных издания. В “Статистическом ежегоднике” (“Statistical Yearbook”) в сжатом виде приводятся данные по народонаселению, экономической деятельности, системе образования, средствам связи всех стран мира. “Статистический ежегодник государственных бюджетов” (“Yearbook of National Accounts Statistics”) содержит подробную информацию об экономической [c.313] деятельности, а “Демографический ежегодник” (“Demographic Yearbook”) – исторические сведения по народонаселению, а также специальные очерки по отдельным проблемам (по территориальному распределению населения, по уровням смертности, по этническому составу населения и пр.). Кроме того, ЮНЕСКО публикует “Статистический ежегодник” (“Statistical Yearbook”), в котором суммируются данные документов ЮНЕСКО по вопросам народного образования, здравоохранения и др. Существует также “Ежегодник государственного деятеля” (“Statesman’s Yearbook”), предоставляющий подробную информацию о различных странах, собранную из ряда государственных и международных источников. “Ежегодник Европы” (“Europe Yearbook”) несет в себе различные сведения по европейским, а в последние годы и по неевропейским странам (в удобной для использования форме). Дополнительные цифры итогового характера можно обнаружить в изданиях “Мировой альманах” (“World Almanac”) и “Энциклопедия стран мира” (“Worldmark Encyclopedia of Nations”), снабженных хорошими указателями. Много экономической информации содержится в “Статистическом ежегоднике международной торговли” (“Yearbook of International Trade Statistics”).

3. Данные по правительственным учреждениям в США. Американские федеральные и местные органы власти выпускают тысячи публикаций, отражающих различные аспекты положения в обществе и их собственной деятельности и приуроченных к проведению различных мероприятий государственной политики. Конечно, в качестве наиболее плодовитого поставщика информации выступает федеральное правительство, чьи многочисленные публикации перечисляются в “Ежемесячном каталоге публикаций правительства США” (“Monthly Catalog of U.S. Government Publications”). Если вы приблизительно знаете, от какого ведомства или правительственного органа может исходить интересующая вас информация, то в “Ежемесячном каталоге” вы можете обнаружить сведения о публикациях этого органа. “Окружной ежегодник” (“County Yearbook”) .и “Муниципальный ежегодник” (“Municipal Yearbook”) содержат данные местного уровня по политическим, экономическим и демографическим переменным. [c.314]

4. Событийная информация. По своей природе событийные данные не могут фиксироваться регулярно и в сжатой форме. Их приходится отыскивать в текущих сводках новостей, составляемых, как правило, без какой-либо оглядки на специфические интересы политологов. Два наиболее полных источника газетных новостей – это указатели (индексы) к “Times of London” и “New York Times”. Еженедельный дайджест текущих событий (с распределением их по темам) представлен в “Facts-on-File”; впоследствии эти сведения собираются в ежегоднике “New Dictionary”, уделяющем основное внимание событиям внутри и вокруг США. “Deadline Data on World Affairs” сообщает о событиях в мире, группируя их по странам и темам. По-видимому, самым пространным дайджестом новостей общего характера является “Keesing’s Contemporary Archives: Weekly Diary of World Events”, где печатаются стенограммы важнейших речей, информация о выборах и сводки новостей, а также имеются предметный и именной указатели.

5. Опросные данные. Все перечисленные выше источники представляют данные в печатном виде. Использование их в крупных исследовательских проектах предполагает необходимость аккуратной регистрации данных и приведения их к машинночитаемому виду. Наиболее полезные источники опросных данных, наоборот, являют собой множества необработанных данных, зафиксированных в машинно-читаемой форме. Доступ к ним можно получить в ряде архивов данных, о которых мы говорили выше.

Важно упомянуть о том, что существует также много частных источников данных. Какие из них способны пригодиться в каждом конкретном исследовании, определяется спецификой предмета исследования. Если исследование касается структуры капиталовложений западноевропейских компаний, то полезные для нее данные можно найти в частных банках или общенациональных и международных ассоциациях банков. [c.315]

СБОР СВОДНЫХ ДАННЫХ

Установив, какие источники данных нужны для исследования, исследователь оказывается перед проблемой перевода данных источника в пригодную для использования форму (кроме тех случаев, когда данные записаны на [c.315] перфокартах и магнитных носителях). Основная задача тут заключается в систематическом кодировании и регистрации данных.

Хотя эти операции займут всего лишь малую долю того времени, которая понадобилась бы для сбора тех же самых данных полевым способом, тем не менее такая работа может оказаться весьма трудоемкой. Поэтому очень важно организовать ее как можно более эффективно. Прежде всего следует заранее тщательно обдумать план исследования и ход намечаемого вами анализа данных, с тем чтобы уяснить для себя, применительно к каким именно случаям вам необходимы сводные данные и какие именно меры вас интересуют в отношении каждого из этих случаев. Не сделав этого, вы рискуете потерять время на фиксацию в конечном счете ненужных вам данных. Более того, если достаточно тщательно спланировать исследование, составив список приоритетных случаев и переменных, то при внезапно обнаруживающейся нехватке времени или средств на сбор данных можно будет легко принять наиболее рациональное решение, выключив из рассмотрения некоторые случаи или переменные, так чтобы обойтись при этом по возможности малыми жертвами. Если не принять такого решения, то это будет значить, что надо действовать строго последовательно, собирая либо сразу все данные по каждому случаю (в ситуации, когда вы хотите оставить за собой право опускать по ходу дела какие-то случаи, сохраняя, однако, все переменные), либо данные сразу по всем случаям для каждой переменной или собирать данные для всех случаев по каждой переменной в отдельно взятый момент (если вам нужна эта информация, но вы хотите иметь возможность исключить некоторые переменные).

Так или иначе вам понадобятся два основных средства сбора данных: набор спецификаций данных и регистрационный бланк данных (recording form). Спецификации данных – это просто подробные описания данных, подлежащих регистрации для каждого случая и для каждой переменной, включая любые инструкции по кодированию. Иногда в качестве спецификации может выступать одна-единственная фраза (в случае данных переписи и ведомственной статистики), например общая численность муниципальных служащих в 1980 г. или взрослое население [c.316] страны в 1970 г. Случается, однако, что простые по видимости данные требуют пространных спецификаций. Например, если мы хотим получить цифру, отражающую общую величину государственных расходов на программы социального обеспечения в каком-то определенном году, нам придется сформулировать, что в рамках данного исследования понимается под “программой социального обеспечения”; если нам нужна мера численности личного состава вооруженных сил государства, то мы должны будем включить в спецификацию этой меры оговорку, исключающую из подсчета полицейские силы применительно к тем странам, где полиция формально входит в состав вооруженных сил. Навыки работы с подобными деталями приходят в результате предварительного изучения, с одной стороны, предмета исследования, а с другой – различных систем фиксации конкретных единиц анализа. Но и после такого изучения исследователь может столкнуться с дополнительными трудностями. Так, например, может выясниться, что запланированные бюджетом и реальные расходы на социальное обеспечение сильно различаются или что в исследовании, предполагающем анализ временного ряда, необходимо учитывать поправки на инфляцию. Но какую бы корректировку ни приходилось вносить в исследование в ответ на подобные “хитрости” материала, делать это надо методологически грамотно и сообразуясь со значением понятия, операционализированного посредством конкретной меры.

При сборе событийной информации понадобятся очень подробные спецификации данных, гарантированно учитывающие все значимые различительные признаки. К примеру, может оказаться необходимым различать беспорядки и мирные демонстрации, про- и антиправительственные демонстрации и т.д. Самый надежный способ это сделать – занести в кодировочную инструкцию, которой предстоит пользоваться кодировщику при заполнении листа регистрации, те признаки (пусть даже мелкие), которые отличают интересующее исследователя событие от других событий. (О кодировании см. подробнее в гл.12.)

Регистрационный бланк предназначен для облегчения процесса сбора данных. Это аналог бланка интервью, используемого в опросном исследовании, поскольку, как и [c.317] бланк интервью, регистрационный бланк является средством систематизации и кодирования наблюдений. Если данные предстоит впоследствии переносить на перфокарты или на дисплей, в листе регистрации для ускорения ввода в машину может быть оговорена ширина каждого столбца, рассчитанного на запись того или иного типа информации. В книге Т.Р. Гурра¹¹ приводится пример заполнения регистрационного бланка событийных данных (см. рис. 10.2 и 10.3). [c.318]

ВЫВОДЫ

Мы хотели бы призвать начинающих исследователей отдать должное потенциальным возможностям сводных данных как дополнения к другим видам данных. Хотя существует множество исследований, опирающихся исключительно на сводные данные, последние часто могут быть использованы также и для контрольной проверки точности результатов, полученных на основании данных других видов. Например, те, кому доводилось изучать поведение избирателей на выборах, наверняка сталкивались со случаями, когда те люди, которым свойственно всегда занимать сторону победителя, в интервью, взятых после выборов, начинают обманывать, заявляя, что они голосовали за победившего кандидата. Долю ложной информации в выборке здесь могут помочь оценить как раз сводные данные по результатам голосования. Если из ответов опрашиваемых следует, что за победителя на последних президентских выборах голосовало 75% избирателей округа, а статистика результатов голосования говорит, что реально за него голосовало лишь 25% избирателей, то результаты опроса придется признать недостаточно (по меньшей мере) валидным показателем той степени поддержки, которой победивший кандидат пользуется в данном округе.

Кроме подобного применения, возможно использование сводных данных в качестве основы для выработки дополнительных показателей понятий, что позволяет контролировать валидность с помощью множественных показателей (этот подход обсуждался нами выше). Так, желая определить степень стабильности социально-политического положения в некотором районе, мы могли бы, с одной [c.318] стороны, опросить жителей на предмет того, собираются ли они и дальше проживать в этом районе, а с другой – в качестве дополнительного показателя изучить сводные данные о частоте смены домовладельцев в районе за последние несколько лет. Когда результаты исследования подтверждаются данными, собранными столь различными методами, степень доверия к этим результатам сильно возрастает. [c.319]

11-лекция. ПОВЕРХ ГРАНИЦ: ПРАКТИКА СРАВНИТЕЛЬНЫХ ИССЛЕДОВАНИЙ

Все те исследовательские стратегии, с которыми мы до сих пор имели дело, без труда можно было реализовать, не выходя – как в буквальном, так и в переносном смысле – за пределы одной страны. По большинству политических вопросов – начиная с проблемы полномочий правоохранительных органов и кончая поиском коррелятов политической активности масс – мы можем получить исчерпывающие данные, исходя из опыта собственной страны. Но в то же время, сосредоточиваясь только на одной стране, мы ограничиваем свой кругозор. Если мы хотим научиться лучше объяснять и предсказывать политические события, то один из путей к этому – обратиться к сравнительному анализу. Такой подход предоставляет нам возможность оперировать более широким кругом данных и одновременно позволяет поднимать такие вопросы, на которые данные одной отдельно взятой страны ответа дать не могут. Касается ли это мотивов политического насилия, причин отчуждения народа от правительства, результатов воздействия различных типов политических организаций на государственную политику или каких-либо других проблем – во всех случаях сравнительный анализ повышает надежность наших выводов.

Зачем, в самом деле, ограничиваться изучением только одной страны? Ведь при этом наши результаты будут прежде всего культурно обусловленными. Дело в том, что каждая страна обладает своими уникальными особенностями, которые могут вызвать смещение в результатах исследования. К примеру, мы хотим выяснить, как социально-экономический статус избирателя влияет на его выбор при голосовании. Если мы будем располагать только американскими данными, то скорее всего придем к [c.329] заключению, что социально-экономический статус и поведение на выборах связаны между собой очень слабо и что неверно полагать, будто политическое поведение определяется теми социально-экономическими условиями, в которых приходится жить и работать избирателям. Если же мы расширим нашу выборку и привлечем данные других стран Запада – скажем, Великобритании, Франции, ФРГ, – то с большой вероятностью обнаружим куда более сильно выраженную зависимость, что отчасти объясняется разницей в историческом развитии социальных классов в этих странах. Таким образом, США не могут служить типичным примером для данного случая¹.

Возьмем другой пример. Допустим, нас интересует, кто и по какой причине воздерживается от голосования на всеобщих выборах. Что касается США, то мы обнаружим, что примерно половина избирателей не приходит в день выборов на избирательный участок. Можно попытаться объяснить это тем, что демократические выборы – особенно на общенациональном уровне – отбивают у избирателей охоту голосовать, поскольку не дают им почти никакой гарантии того, что голос каждого из них может повлиять на исход выборов. Но стоит нам обратиться к данным Западной Европы, как мы придем к совершенно иному заключению. Число не пришедших к урнам в среднем составляло 82% всего числа избирателей в Норвегии в 70-е годы и более 90% в Италии в тот же период, несмотря даже на то, что там в меньшей степени считали, что большое число голосовавших преуменьшает эффект любого отдельного бюллетеня². Таким образом, должны быть другие объяснения тому, почему в США такой низкий процент участия в выборах, и это становится нам ясно только благодаря привлечению данных других стран. Сравнительный анализ показывает, что состязательность в процессе выборов и институционные черты, такие, как относящиеся к выборам законы и существование двух или многопартийной системы, развивались долго и постепенно, что объясняет различный уровень числа голосующих³. Оба рассмотренных нами примера говорят о том, что у американской культуры – как и у любой другой – есть свои специфические черты, которые могут исказить наши выводы. [c.330]

Сосредоточение внимания целиком на одной стране ограничивает нас еще и в следующем отношении: оно мешает нам анализировать явления системного уровня. Другими словами, существуют такие переменные величины (как, например, тип политической системы или тип административно-территориальной организации), которые характеризуют страну в целом и поддаются изучению только при сравнении между собой двух и более стран. Взять, к примеру, проблемы федерализма. У нас может возникнуть желание утверждать, что федеральное устройство (когда власть поделена между правительствами двух и более уровней) способствует неравному распределению государственных средств между отдельными районами страны. Если районные власти независимы от федерального правительства, то их взгляды на то, как и куда тратить правительственные фонды, скорее всего будут отличаться от мнения центральных властей. Чтобы проверить это утверждение, нам нужно для сравнения изучить данные по меньшей мере одной не федеральной, или унитарной, системы (когда отдельные районы формально не располагают властью, независимой от центрального правительства). И только обнаружив значительные расхождения между странами с федеральным и с унитарным устройством, мы будем вправе заключить, что федерализм представляет собой важную переменную, влияющую на распределение государственных средств. Точно так же если мы беремся утверждать, что экономический рост в странах, где индустриализация началась недавно, зависит от способности правительства контролировать трудовые ресурсы. Чтобы проверить это утверждение, нам необходимо иметь выборку, включающую страны с различным уровнем контроля над производством⁴. Таким образом, всякий раз, когда мы затрагиваем свойства системного уровня, мы оказываемся перед необходимостью провести сравнительный анализ на материале двух и более государств.

Сравнительный анализ может оказаться ценным подспорьем также и при оценке политических реформ или их проектов. Изучение опыта других стран помогает лучше понять преимущества и недостатки альтернативных “правил политической игры” и, следовательно, точнее определить потенциальные плюсы и минусы политической [c.331] реформы у себя дома. В 50-х годах в США некоторые эксперты выступали за проведение реформы по образцу британской политической системы, с тем чтобы добиться большего единства внутри основных политических партий и, как следствие, обеспечить для среднего избирателя большую ясность в выборе между партиями. Другие тогда же выдвигали идею пропорционального представительства (система Франции), при котором число мест, отданных некоторой партии в законодательном органе, прямо пропорционально числу голосов, полученных ею на выборах, в результате чего значительное число различных партий и групп имеют в законодательном органе свой голос, соответствующий степени поддержки их электоратом. В каждом из этих случаев опыт других стран много говорит нам как о преимуществах, так и о недостатках соответствующего политического устройства.

Сравнительный анализ является, таким образом, важной составной частью политологического исследования, потому что позволяет делать обобщения поверх узких подчас рамок отдельной культуры, а также осуществлять проверку некоторых системных свойств. Само собой разумеется, такой анализ должен удовлетворять всем тем стандартам качественного исследования, о которых шла речь в предыдущих главах. Кроме того, необходимо придерживаться следующих правил.

Первое правило касается концептуализации предполагаемого объекта исследования: необходимо удостовериться, что вопросы, которые мы ставим, реально допускают проведение сравнительного анализа. Второе правило заключается в операционализации: каждая переменная величина, используемая нами, должна быть эквивалентной мерой понятий, которые соответствует каждой культуре в нашей выборке. Процесс построения выборки в свою очередь приводит нас к третьему правилу: страны для анализа нужно отбирать таким образом, чтобы свести к минимуму влияние культуры, которое может исказить результаты. И наконец, выборка должна удовлетворять еще одному правилу: наблюдения по каждой стране должны быть независимыми.

Теперь рассмотрим каждое из этих требований, объясняя, как они могут влиять на получаемые результаты. [c.332]

ВЫЯВЛЕНИЕ “КОЧУЮЩИХ” ВОПРОСОВ

Первое требование к сравнительному исследованию заключается в том, чтобы ставить только такие вопросы, которые приложимы к разным культурам. В такой формулировке это правило, возможно, покажется очевидным, не нуждающимся в комментарии. Однако его простота обманчива, ибо многие вопросы из тех, что поднимаются в политологии, на деле приложимы только к очень узкому спектру стран. Взять, например, излюбленную в современной политологии проблему объяснения поведения избирателей на выборах. Постоянный интерес к тем факторам, которые обусловливают выбор избирателя при голосовании, привел к появлению целой теории со своим набором изощренных методов, которые по замыслу должны быть применимы в любой политической обстановке, у нас в стране и за ее пределами. Однако вопросы о том, почему и как люди голосуют, – плохие “кочевники”, потому что ограничивают изучение только теми странами, в которых имеют место регулярные выборы на состязательной основе, а такое условие автоматически исключает из рассмотрения более половины государств мира⁵. Мы бы, скорее, согласились исключить обсуждение однопартийных выборов или выборов с одним кандидатом, хотя в этом случае мы могли бы наблюдать несколько иное поведение электората и в основном только один выбор – “воздержаться”. Но когда мало различий – особенно нечего объяснять. Те факторы, которые заставляют людей голосовать тем или иным образом в странах с состязательной системой голосования, не имеют никакого значения в случае выборов, проводимых на конкурентной основе.

Таким образом, выбрав для анализа проблему голосования, мы сформулировали исследовательскую задачу в терминах, применимых лишь к части стран. Возможно, само по себе это и не покажется таким уж сильным недостатком, поскольку наша выборка включает множество стран. Но существует и другая проблема, – проблема получения по материалам голосования выводов более общего характера. Считая, как это делают многие исследователи, что результаты голосования отражают одобрение или неодобрение избирателями политической системы или [c.333] их предпочтение определенного кандидата, партии или политики, мы тем самым рассматриваем выборы как меру для более общего понятия – изъявления населением своих политических предпочтений. А это исключает допущение того, что государства без регулярных выборов на состязательной основе могут предоставлять своим гражданам средства для выражения одобрения, неодобрения или пожеланий правительству.

Так ли это? Или, может быть, мы искусственно ограничиваем наше исследование рамками выборов на состязательной основе? Не придем ли мы к иным выводам, если переформулируем свою задачу? Если, например, мы начнем задавать вопросы по более общей проблеме – проблеме того, как люди выражают свое одобрение, неодобрение или предпочтения в сфере политики, – то обнаружим, что обычные граждане в странах без выборов на состязательной основе имеют возможность донести до правительства свои предпочтения другими средствами, а именно теми, которые в более демократических странах обычно ассоциируются с бросанием бюллетеня в урну⁶.

Например, голосование может быть формальностью, но граждане могли бы рассмотреть другие формы участия в гораздо более благоприятном свете. Таким образом, множество людей, игравших активную роль в советских общественных организациях (таких, как домовые комитеты или профсоюзные комитеты) в брежневскую эпоху, чувствовали, что они имеют влияние и широкие полномочия в своих организациях и в советском обществе, хотя в то время “выборы” единственного кандидата были, скорее, политическим ритуалом⁷. И множество активистов, участвовавших в общественной жизни, чувствовали, что их деятельность имеет вес и значение и изменяет ход событий, хотя они и не были удовлетворены системой в целом⁸.

В дополнение можно сказать, что, даже если выборы в коммунистических странах традиционно предлагали очень ограниченное число возможностей “для выбора”, избиратели все же в известном смысле использовали их, чтобы “озвучить” свои требования к деятельности правительства. Например, в СССР избиратели имели несколько путей, чтобы посредством голосования “надавить” на местные власти, даже когда выбирался единственный [c.334] кандидат. Коммунистическая партия, как правило, ожидала, что представители местных властей обеспечат как можно более высокий процент голосования, а это давало в руки избирателей своего рода рычаг, позволявший требовать улучшений в сфере коммунальных услуг. Иногда избиратели грозили воздержаться от голосования, если местные власти не пойдут навстречу их требованиям, касающимся улучшения жилищных условий, состояния дорог, водопровода, канализации. (Тем не менее не все их требования могли быть удовлетворены, и некоторые избиратели никогда даже не регистрировались, чтобы не участвовать в выборах)⁹.

Более того, хотя в социалистическом государстве избиратель, возможно, и не решал, кто будет управлять страной, у него (нее) было несколько путей донести до правительства свое мнение или свои предпочтения в отношении действий властей. Существовал и такой путь: обратиться с вопросом или жалобой. Официальная пресса ежедневно публиковала вопросы и предложения читателей по поводу деятельности государственных учреждений, начиная с вопросов качества потребительских изделий и кончая вопросами охраны окружающей среды и безопасности атомной энергетики. Жители могли также обращаться непосредственно в государственные учреждения с просьбами помочь в разрешении жилищных или пенсионных проблем¹⁰. Круг таких проблем, разрешенных к обсуждению, был, конечно, ограничен; “политические” жалобы на высших политических лидеров или на роль партии, например, могли повлечь серьезные репрессии. И все же, как сообщали многие граждане, они получили существенную поддержку от редакций по вопросам жизнеобеспечения, далеким от политики. У некоторых советских граждан был еще один канал воздействия на власти: государственные учреждения часто консультировались у групп специалистов по той или иной проблеме, предоставляя наиболее заинтересованным лицам возможность повлиять на государственные решения¹¹.

Очевидно, что система участия граждан в такого рода делах разительно изменилась, когда Михаил Горбачев начал кампанию за более открытые выборы, более широкое участие граждан, и более широкие гражданские свободы и [c.335] за появление 15 новых государств на месте бывшего Советского Союза. Но все же в гражданской политике существуют некоторые противоречащие этому процессы, тянущиеся еще с до перестроечных времен. Граждане продолжают контактировать с властью, и прежде всего по основным вопросам жизнеобеспечения, таким, как жилье. И множество людей, проявляющих ныне активность в новых, неформальных политических организациях, были активистами и в “старых” общественных организациях. Поскольку мы концентрировали наше внимание прежде всего на обсуждении голосования как меры участия в процессах демократического правления, то они и были рассмотрены. Важным пунктом здесь является то, что в каждой стране гражданам могут быть предоставлены различные способы выражения предпочтения или несогласия с тем, что делает правительство. И именно это мы должны изучать в том случае, если мы нацеливаем наше исследование только на изучение поведения электората в странах с выборами на состязательной основе.

Рассмотрим другой пример. Возможно, мы захотим исследовать судебные дела в различных странах на предмет того, насколько они отражают связи между политическими институтами, как часто происходят тяжбы и каковы судебные решения. Здесь, как мы увидим, процесс сравнения также будет затруднен, поскольку общество может иметь самые различные образцы разрешения конфликтов и спорных вопросов. В некоторых странах основной акцент может делаться на разрешение конфликтов с помощью прежде всего местных авторитетов, а не в суде, и такие страны мы исключим из нашего анализа, поскольку мы изучаем именно официальные судебные процедуры¹². Если же мы, как всякий политолог, хотим получить надежные выводы, не зависящие от той или иной культуры, тогда нашу исходную исследовательскую задачу следует сформулировать так, чтобы она позволяла делать обобщения, выходящие за рамки одной или нескольких стран.

Исходный вопрос должен быть также корректен в применении к изучаемым нами странам. Предположим, например, что мы изучаем проблему прав женщин в США, Западной Европе и странах – членах СНГ. В теории мы [c.336] должны предположить, что в посткоммунистических государствах, более чем в других, мужчины и женщины имеют равные права на работу в связи с традиционной идеей равенства полов. Но если сфокусировать внимание только на праве на работу, станет ясно, что ситуация переломная. В ходе дискуссии о правах женщин в посткоммунистических государствах выяснилось, что множество женщин предпочли бы вести хозяйство, а не бороться за работу на рынке труда. Таким образом, окончательно сформулированный вопрос выглядел бы так: “Сколько спорных вопросов о женских правах стоит на политической повестке дня в каждом государстве?”. Наш исходный вопрос, следовательно, нуждается в переформулировке в терминах, применимых ко всем изучаемым нами странам.

В нашем кратком обсуждении мы не касались проблемы всех тех культурных влияний, которые способны наложить свой отпечаток на исходную исследовательскую задачу. А именно: мы до сих пор имели дело только со случаями развитых индустриальных обществ, в которых правительство воплощено в обширной, высокоспециализированной бюрократической машине. Понятно, что в обществах без такого рода институтов (а таковы многие развивающиеся страны) способы политического самовыражения, равно как и обеспечение жителей общественными благами, принимают совершенно иные формы, и это необходимо учитывать при формулировке исследовательских вопросов. И все же, каковы бы ни были исследовательский вопрос и страна изучения, мы в любом случае должны удостовериться, что наше исследование строится так, что позволяет делать обобщающие выводы и адекватно вписывается в контекст изучения тех стран, к которым мы обращаемся. Наш проект, по сути дела, должен уметь “кочевать” и сосредоточиваться на вопросах, корректных в применении к нашей окончательной выборке. [c.337]

ПОИСК ЭКВИВАЛЕНТНОЙ МЕРЫ

После того как мы определили для себя вопрос, допускающий сравнительный подход, нам предстоит отыскать [c.337] эквивалентную меру для всех рассматриваемых стран. Иначе говоря, сравнительное исследование должно в разных культурах измерять одно и то же понятие. Этого можно достичь двумя способами: либо используя везде одну и ту же переменную, либо выбирая переменные, специфичные для каждой страны. Такая альтернатива может показаться на первый взгляд однобокой: ведь ничто так не обеспечивает эквивалентности в подходе к разным странам, как использование одной и той же переменной. Это верно, однако, только в том случае, если наша “единая” переменная для каждой из изучаемых нами стран означает одно и то же.

Чтобы понять, в чем здесь таиться трудность, представим, к примеру, что мы поставили цель сравнить уровни терпимости к правам меньшинств применительно к обществу. Существует два подхода. Во-первых, мы можем сравнить, до какой степени люди в разных странах желают обеспечить политическими правами определенные группы, например, религиозные секты. Если основываться на этом измерении, то мы, вероятно, придем к заключению, что граждане отдельных стран более терпимы, чем другие. Но если люди в изучаемой нации более или менее враждебны к такой группе, то наше измерение покажет, как люди разных стран воспринимают группу, а не терпимость к правам меньшинств. Это означает, что наша “тождественная” мера терпимости неодинакова в различных государствах.

Однако мы можем использовать второй путь. Мы можем узнать, желают ли люди признать политические права групп, которые им совершенно не нравятся. Это позволит нам проконтролировать различия в восприятии различных групп в различных странах. Однако тогда встает еще один вопрос. Некоторые народы особенно не любят группы, которые а) более многочисленны и б) более влиятельны, чем в других странах, где та же самая группа может быть очень маленькой и слабой. Если так, то степень, с которой люди хотят признать политические права группы, может отражать уровень угрозы, которую группа составляет для большинства нации. В этом случае наша мера может отражать более уровень страха граждан, чем меру их политической терпимости. Таким образом, для [c.338] того чтобы наши сравнения были весомыми, нам нужна мера, которая бы адекватно отражала одно и то же лежащее за ней понятие, какие бы страны мы ни включали в нашу выборку.

Подобные проблемы возникают постоянно, вне зависимости от того, какой вопрос или какую страну мы рассматриваем. Например, мы хотим сравнить уровни социального обеспечения в странах, находящихся на разных ступенях социально-экономического развития. Можно предположить, что в более развитых странах на социальные программы выделяется больше средств. И наоборот, чем более слаборазвита страна, тем меньше она выделяет средств на социальные нужды. Казалось бы, не так трудно определить однозначную меру уровня социального обеспечения: стоит только оценить долю расходов на программы социального обеспечения (пенсии, помощь инвалидам и беднякам и пр.) в общем объеме государственных расходов или в общем объеме произведенных товаров и услуг (измеряя его совокупным общественным продуктом). Применяя эту меру, мы скорее всего обнаружим, что наше предположение верно: чем более развита страна, тем большая доля средств выделяется в ней на социальные нужды.

Однако и здесь наша мера может оказаться неприложимой к целому ряду стран. Определяя ее в терминах таких формальных параметров, как правительственные выплаты пенсионерам, инвалидам и нуждающимся, мы можем недооценивать степень участия неформальных или местных организаций в оказании помощи нуждающимся в тех странах, где официальные социальные программы либо не существуют, либо ограничены по масштабам. Когда в слаборазвитых странах фермеры или односельчане организуют помощь своим неимущим родственникам или соседям, предоставляя им пищу, кров и т.п., то они, по сути дела, занимаются перераспределением общественных средств в том же глубинном смысле, в каком это делают социальные программы в развитых странах. Следовательно, разные сообщества могут опираться на разные способы обеспечения нуждающихся, и мера, учитывающая только официальные программы помощи, вполне может исключить из поля зрения исследователя [c.339] неофициальные, но отнюдь не менее важные действия по перераспределению средств. В этом случае наша мера социального обеспечения отражает не столько заботу о нуждающихся, сколько общий уровень институционализации в стране.

Оба примера показывают, что использование одной меры для всех стран может привести к серьезным промахам в том случае, если наши переменные в разных странах наполняются разным содержанием. В качестве альтернативного решения мы можем использовать в применении к каждой изучаемой стране свою, специфичную переменную, ставя ее выбор в зависимость от конкретной культуры. В этом случае мы должны удостовериться, что каждая такая переменная отражает одно и то же базовое понятие. Как и при выборе единых или общих показателей, это может представить определенную трудность, поскольку нет гарантии, что выбранные нами переменные равнозначны (эквивалентны). В подтверждение этому рассмотрим проблему политического протеста. Ясно, что поскольку в каждой политической системе действуют свои правила, регулирующие политическую жизнь, то и протест против системы может принимать в разных странах неодинаковые формы. В то время как в одной стране правительство разрешает массовые демонстрации и существование инакомыслия, правительство другой страны за то же самое подвергает своих граждан серьезным наказаниям, вынуждая их искать другие способы выражения своего недовольства. Так, можно было бы утверждать, что в странах, где открытое инакомыслие наказуемо, люди протестуют скрытыми способами, к которым относится уклонение от требований и предписаний правительства¹³. Лишенные возможности открыто выразить свое несогласие с системой, люди могут обратиться к таким средствам борьбы, как растрата государственных средств, уклонение от уплаты налогов, злоупотребление бюрократическими инструкциями. Таким образом, чтобы сравнить антиправительственную деятельность в разных странах, мы будем в одних случаях рассматривать открытые выражения протеста, а в других – “беловоротничковую” преступность (если допустить, что мы умеем ее измерять). Вполне правдоподобно, что обе эти переменные являются эквивалентными мерами протеста, но у нас нет достаточно убедительных [c.340] доказательств этого. Другой исследователь на нашем месте, возможно, стал бы утверждать, что эти два вида деятельности на самом деле отражают разные вещи: открытый протест – это хороший барометр нашего базового понятия, а “беловоротничковая” преступность – нет. Люди могут растрачивать государственные средства, уклоняться от уплаты налогов, злоупотреблять своим служебным положением в силу самых разных причин, вовсе не обязательно напрямую связанных с недовольством политической системой или с протестом против нее. Если это так, то обе наши меры не эквивалентны и в разных странах мы имеем дело с явлениями разного порядка. Другими словами, “беловоротничковая” преступность, возможно, не является в данном случае надежным показателем, потому что отражает не совсем то, что мы хотим измерить. Следовательно, использование специфичных для каждой страны переменных лишает нас гарантии, что мы оперируем данными, сравнимыми по всем странам нашей выборки.

Все это означает, что обе возможности выбора переменных, стоящие перед нами, – будь то использование одного и того же или культурно обусловленных показателей – имеют свои ограничения. Ни одна из них не гарантирует эквивалентности переменных. Вместе с тем можно предложить несколько путей разрешения этой проблемы. Во-первых, необходимо хорошее, основательное знание культуры каждой изучаемой страны, которое позволяло бы определить адекватность применения к ней конкретной меры. Во-вторых, необходимо использовать сложные меры или показатели. Если, например, мы в состоянии определить несколько различных способов измерения протеста и если они приводят нас к одинаковым выводам, – то мы можем быть до некоторой степени уверены, что наши измерения верны. Следование этим стратегиям помогает получить эквивалентные, или сравнимые, данные для всех изучаемых нами стран. [c.341]

ОТБОР СТРАН ДЛЯ ИЗУЧЕНИЯ

Разобравшись с проблемами адекватности исследовательского вопроса и эквивалентности измерения, исследователь сталкивается с проблемой построения выборки. [c.341] В идеальном варианте мы не должны были бы выбирать между странами: ведь лучший способ предохранить наши результаты от культурной обусловленности – это включить в выборку данные всех стран, какие только есть на свете. Но на практике наши возможности гораздо скромнее, ибо доступные нам данные ограничены. Если например, мы опираемся на официальные источники информации, то нас будет связывать то обстоятельство, что многие страны не публикуют совсем или публикуют очень мало информации по интересующим нас вопросам. В некоторых странах точные и своевременные публикации политических, экономических и социальных данных все еще дорогостоящая роскошь. И даже там, где исследования возможны, некоторые темы остаются весьма деликатными (такие, как данные по политическим беспорядкам) или слишком прозаическими (например, статистика по бытовым преступлениям), чтобы их публикация была оправданной. Те же, которые публикуют достаточно такой информации, зачастую используют совершенно несхожие методы получения и регистрации данных (отчетности), в результате чего опубликованная ими информация может оказаться непригодной для сравнения. Если же, с другой стороны, мы хотим собрать свои собственные данные, например с помощью опроса, то количество собранных сведений будет ограничено, так как стоимость может быть весьма высокой.

Все эти ограничения означают, что в отношении большинства исследовательских вопросов нам придется работать с выборкой из нескольких стран, отобранных специально так, чтобы свести к минимуму возможные искажения. Выбор следует делать весьма осторожно, поскольку, он может ощутимо сказаться на наших результатах. Мы вправе избрать одну из двух стратегий, принятых в сравнительных исследованиях. Первая, называемая принципом максимального сходства систем, концентрирует внимание на сходных между собой странах на том основании, что общие для них особенности при анализе можно интерпретировать как константы и далее пренебречь ими, считая, что причины возможных расхождений лежат не в них. А если страны различаются какими-то другими чертами, [c.342] мы можем игнорировать одинаковые характеристики как объясняющие разновидности¹⁴.

Чтобы наглядно представить себе этот принцип в работе, вообразим, что мы взялись исследовать различия в масштабах правительственной деятельности в разных странах. Почему в одних странах правительства играют большую роль в экономике и политике, чем в других? Тут допустимы разнообразные объяснения – от различий в уровне экономического развития до различий в политической культуре. Однако политическую культуру порой трудно точно измерить. И значит, есть смысл отсечь ее как фактор, влияющий на различия в масштабах правительственной деятельности, взяв для анализа страны со сходными политическими культурами, как, например, Великобритания и США. Тогда все те различия, которые мы обнаружим в масштабах действий их правительств, нельзя будет отнести на счет политико-культурных факторов, поскольку эти факторы в грубом приближении постоянны во всей нашей выборке. Иначе говоря, отбор стран со сходными чертами означает, что при объяснении обнаруженных нами различий мы можем спокойно исключить эти сходные черты из рассмотрения.

В качестве альтернативы можно воспользоваться и диаметрально иной стратегией, заключающейся в отборе стран с максимально возможным числом расхождений между ними. Это то, что называется принципом максимального различия систем. В этом случае, когда мы находим среди стран нашей выборки какую-либо общую особенность, различия между этими странами мы исключаем из объяснения. В качестве примера приведем ранее рассмотренный вопрос о социальном обеспечении. Можно было бы отобрать ряд стран с разными уровнями экономического развития и с разными типами политической системы и, прилагая к каждой из них эквивалентную меру, обнаружить, что они вкладывают в социальное обеспечение приблизительно равные доли государственных средств. А коли так, то, следовательно, различия, существующие между ними, не влияют на размеры их помощи нуждающимся согражданам. Или рассмотрим связь между социальным положением, условиями работы и индивидуальными достоинствами. Исследования в Соединенных [c.343] Штатах показали, что люди, имеющие более высокий статус работы (требующие более высокого уровня образования и соответственно хорошей оплаты), преимущественно ценят труд, позволяющий решать сложные задачи, избегают рутины и стремятся работать самостоятельно, без чьего-либо руководства. Одно логическое объяснение этому лежит в американской индивидуалистической культуре. В стране, где ценят права личности и самостоятельность, автономия в сфере работы поощряется. И эта автономия может особенно превалировать на высших уровнях профессиональной иерархии. И все же данные сравнительных исследований по разным странам позволяют подвергнуть сомнению это культурологическое объяснение. Ведь такая же связь между социальным положением, условиями работы и индивидуальными достоинствами наблюдается в таких разных странах, как Польша и Япония¹⁵. Таким образом, влияние социальной структуры и характеристик работы не зависит от страны, которую мы изучаем. Отбор стран, различающихся по ряду параметров, позволяет нам пренебречь чертами различия при объяснении какой-то общей для них особенности.

Какую же из этих двух стратегий нам предпочесть? Ответ отчасти зависит от того, насколько хорошо разработана теория, которой мы руководствуемся в нашем исследовании. Так, принцип максимального сходства систем более уместен тогда, когда мы в состоянии а) установить все основные факторы, могущие влиять на наши результаты, а также б) определить страны, в которых они действуют. Но поскольку в такие рамки обычно укладывается совсем немного стран, то куда проще, как правило, найти примеры, сильно различающиеся по ряду важных параметров. И в этом случае более подходит принцип максимального различия систем. Кроме того, обнаружение какой-либо общей особенности между сильно различающимися странами – весьма маловероятное событие, поэтому если уж оно происходит, то это дополнительно повышает доверие к нашим результатам. Значит, принцип максимального различия систем фактически позволяет нам лучше контролировать факторы, могущие исказить результаты; кроме того, он обеспечивает большую надежность результатов. [c.344]

ОТБОР НЕЗАВИСИМЫХ НАБЛЮДЕНИЙ

При построении выборки мы обычно руководствуемся тем, что чем больше стран мы включим в нее, тем большей представительностью будут обладать наши результаты. Большой объем выборки, увеличивая вероятность того, что отобрана достаточно представительная группа значений, принимаемых ключевыми переменными, придает больший вес используемым статистическим методам. Это верно, однако, только тогда, когда результат каждого наблюдения является независимым. Большая выборка сохраняет свои преимущества, только если события в какой-то одной стране не находились под влиянием событий в какой-то другой стране. Если эти события не являются независимыми, то тогда за нашими результатами стоит в действительности не две, а одна порция информации.

Возьмем пример из истории стран социалистического блока. Когда в 1953 г. умер И. Сталин, в СССР и его восточноевропейских сателлитах произошли крупные изменения: в большинстве этих стран сменилось руководство и была пересмотрена политическая стратегия, навязывавшаяся ранее Сталиным. Вплоть до 1953 г. основным приоритетом почти во всех этих странах являлось развитие тяжелой промышленности, даже если это влекло за собой сокращение жилищного строительства и производства потребительских товаров. После смерти Сталина большинство социалистических стран начало уделять больше внимания улучшению жизни простых граждан. Можно было бы сделать из этого вывод, что эти перемены в руководстве и в политике явились частью естественного прогресса или тенденции в политическом развитии стран социализма и что подобные изменения происходят в социалистической стране закономерно, когда она достигает определенного уровня развития. Такой вывод на первый взгляд подтверждают данные разных стран. Однако наблюдения в нашей выборке не являются независимыми, поскольку как смена руководства, так и изменение политического курса в странах советского блока были инициированы, а возможно, и срежиссированы Советским Союзом. Таким образом, наш вывод относительно того, что перемены в странах Восточной Европы были вызваны [c.345] естественной тенденцией в их развитии, оказывается неверным, поскольку в действительности эти перемены имели один источник – события только в одной стране, а именно в СССР.

Процесс, при котором события в какой-либо одной стране влияют на жизнь какой-либо другой страны, называется диффузией, а проверка его воздействия на результаты сравнительного исследования получила название проблемы Гальтона – по имени ученого, который впервые ее описал. Эта проблема заключается в том, что мы, случается, усматриваем сильную причинную связь между двумя переменными (например, между достижением страной определенного уровня развития и происходящими в ней изменениями в руководстве и политическом курсе) там, где в действительности ее не существует, – исключительно потому, что некоторые страны из нашей выборки находятся под общим для них влиянием какой-то другой страны. В этом случае увеличение объема выборки не имеет смысла, ибо любые дополнительные наблюдения реально не дают никакой новой информации.

На самом деле довольно трудно составить такую выборку, в которой все данные были бы совершенно независимыми. Некоторая степень диффузии почти неизбежно будет присутствовать фактически во всем, что мы изучаем при сравнительном анализе. Если это так, то нужны методы ослабления ее воздействия. Само собой разумеется, один из таких методов состоит в том, чтобы выявлять в выборке все явные признаки влияния одной страны на другую, после чего исключать последнюю из анализа. Другой способ состоит в использовании принципа максимального различия систем, когда отбираются страны, расходящиеся по возможно большему числу признаков, а также наблюдения, относящиеся к разным периодам времени. Если учесть, что действие диффузии со временем и с расстоянием ослабевает, то такая стратегия увеличит шансы на то, чтобы данные нашей выборки были независимыми. [c.346]

ОТБОР МАТЕРИАЛА

Каждый вопрос из рассмотренных выше соответствует одному из этапов сравнительного исследования – от корректной постановки исследовательской задачи до выбора [c.346] адекватной меры и построения выборки. Окончательный (по крайней мере в теории) этап состоит в отборе фактического материала (заметим, что на практике этапы могут меняться местами). Отбор данных, разумеется, будет зависеть от выбранных нами для изучения темы, страны и периода времени. Здесь открывается столь широкий спектр возможностей, что мы ограничимся указанием лишь на наиболее известные источники политологических данных. Более специальные сведения можно почерпнуть в исследованиях, посвященных частным вопросам или отдельным странам. Чтобы наметить некоторые возможные варианты, обратимся к двум видам примеров – со сводными и с опросными данными.

Что касается сводных данных, то здесь наиболее полными и удобными источниками являются справочники, такие, как справочник Бэнкса и справочник Тэйлора и Джодиса¹⁶. Бэнкс приводит сведения по политическим, экономическим и демографическим показателям более чем 150 стран начиная с конца XIX в., что позволяет анализировать долговременные процессы практически в любой части света. В то же время такой широкий охват материала позволяет увидеть и некоторые недостатки сводных данных. Один из них заключается в том, что для многих стран просто не существует непрерывных данных по некоторым важным показателям (переменным). Бэнкс в этих случаях дает усредненные или интерполированные цифры, выведенные из имеющихся данных. Такое решение вполне закономерно, однако оно начинает вызывать сомнение в том случае, если мы намереваемся изучать изменения во времени: при оценке результатов наблюдений Бэнкс исходит из предположения о равномерности общественного развития, поэтому его данные неизбежно создают видимость постепенных пропорциональных изменений, происходящих из года в год, что на самом деле может не соответствовать действительности.

В связи с данными Бэнкса возникают и другие вопросы, например вопрос о взаимозависимости между числом охваченных стран и лет и точностью каждого наблюдения. Чем больше стран включено в рассмотрение, тем труднее гарантировать, что данные по разным странам измерены точно и эквивалентно. При большом числе стран сложнее [c.347] найти точное определение таких величин, как, например, расходы на оборону, а также удостовериться в том, что в случае каждой страны мы измеряем одну и ту же величину. Здесь могут возникнуть серьезные проблемы, как, например, при сравнении Запада и Востока. Бюджетные цифры всех военных расходов в странах коммунистической ориентации традиционно преуменьшались, и поэтому на них нельзя особо полагаться при выверке сообщенных данных. Однако Бэнкс полагается именно на эти официальные цифры, что вызывает сомнение в надежности сравнений военных расходов на основании данных его справочника. Подобного рода несоответствия пронизывают практически весь его материал; это значит, что в данном справочнике переменные имеют одинаковые названия, но означают разное.

Тэйлор и Джодис несколько лучше справляются с этой проблемой, так как в их справочнике предусмотрена сложная система перепроверки данных по разным источникам, гарантирующая их эквивалентность для более чем 100 стран в фиксированные годы. У этого справочника есть и другие преимущества, а именно в нем приводятся: (а) обзор расхождений, имеющихся в различных типах данных, и обсуждение необходимых корректировок; (б) обсуждение политологических теорий, оперирующих приводимыми в справочнике данными. Недостатком справочника является то, что упор на эквивалентность данных неизбежно сужает охват и по большинству переменных данные приводятся лишь за несколько лет. Поэтому использовать эти данные для изучения долговременных процессов довольно затруднительно.

При изучении таких проблем, как выборы, партии и официальные организации, некоторые справочники по конкретным вопросам будут полезны и облегчат сравнительные исследования. В работе Кеннета Янды изложены основные положения и ключевые данные долгосрочного проекта сравнительных исследований политических партий¹⁷. Данные по правительствам, выборам, населению и социальным показателям в Европе представлены в серии справочников “по политическим фактам”¹⁸. Другой справочник содержит данные по голосованиям и выборам для 24 стран¹⁹. Это, конечно, только малая часть [c.348] информации, на которую мы могли бы сослаться, но эти книги иллюстрируют наиболее общие ограничения, возникающие при сравнительном изучении данных. Естественно, что сравнению лучше поддаются данные по США и Западной Европе, нежели по США и социалистическим или развивающимся странам²⁰.

Другие, более специальные источники сводных данных также вызывают серьезные сомнения. Можно, например, использовать информацию, поставляемую различными исследователями Межуниверситетскому консорциуму политических и социальных исследований (ICPSR – Inter-University Consortium for Political and Social Research) и хранящуюся в Мичиганском университете – это избавило бы нас от задачи сбора данных. Но, полагаясь на чужие работы, мы с очевидностью ограничиваем свой выбор теми странами, переменными и периодами времени, которые были отобраны другими исследователями. Один из способов обойти это неудобство – добрать недостающие данные из других источников, как-то: из ежегодных справочников ООН по международной статистике или из официальных публикаций отдельных стран. Тем самым мы возьмем выборку под свой контроль, однако одновременно перед нами встанет проблема эквивалентности. Дело в том, что в разных странах для характеристики данных используются слегка различающиеся между собой определения, и привести такие данные к единому знаменателю оказывается вовсе не просто. Более того, публикации таких международных организаций, как ООН, обычно основываются на отчетах отдельных стран, что ограничивает сравнимость данных в том же отношении. При сборе и публикации данных каждая страна может преследовать свои собственные цели и использовать свои оригинальные методы, которые к тому же со временем могут меняться. Если вернуться к нашему примеру, это означает, что в графу “военные расходы” в разных странах могут быть включены разные виды ассигнований. Эта проблема решается только с помощью подробного анализа ситуации в каждой из изучаемых нами стран.

Подобные же ограничения возникают и при использовании данных индивидуального опроса, полагаемся ли мы при этом на чужую информацию или собираем [c.349] материал самостоятельно. В первом случае мы, естественно, связаны теми переменными и выборкой, которые уже отобрал кто-то другой для анализа других, отличных от нашей проблем. Во втором случае, с другой стороны, мы можем самостоятельно осуществлять отбор переменных и построение выборки. Но – как и в случае со сводными данными – чем больше стран и периодов времени мы включаем в выборку, тем труднее гарантировать, что для каждой (каждого) из них мы измеряем одно и то же. На самом деле проведение индивидуального опроса в чужой стране может оказаться чрезвычайно сложной задачей. Даже если мы располагаем необходимыми средствами, а также поддержкой правительства в каждой из стран нашей выборки (что само по себе отнюдь не очевидно), перед нами все равно встанет целый ряд проблем.

Первая касается обеспечения языковой эквивалентности опроса, т.е. адекватного перевода наших вопросов с одного языка на другой (другие). Ясно, что это сопряжено с проблемой хорошего владения всеми теми языками, на которых говорят наши респонденты (или с проблемой хорошего переводчика). Однако даже при условии хорошего знания языка у исследователя могут возникнуть определенные трудности при попытке адекватно передать на нем некоторые понятия. В чужом языке может просто не существовать эквивалентов для некоторых специфических для нашей культуры представлений и терминов. Взять, к примеру, понятие “группы по интересам” (группа людей, объединенных общими интересами и пытающихся сообща воздействовать на политику правительства) и понятие “плюрализм” (политическое устройство, при котором различные группы населения сотрудничают и конкурируют друг с другом в борьбе за влияние на правительство). Поскольку оба эти понятия являются продуктом развития западной демократии, для них существуют эквивалентные обозначения во всех культурах западно-демократического типа. Но в других культурах может вообще не существовать ни одного из этих понятий, ибо они являются порождением специфического опыта высокоразвитых политических систем, в рамках которых появляются формально организованные группы населения. При возникновении [c.350] подобных неувязок вопросы приходится переформулировать, используя термины, допускающие эквивалентный перевод.

Помимо концептуальных и языковых различий, между культурами могут лежать и различия в особенностях речевого взаимодействия, влияющие на то, как респондент будет отвечать. Так, в некоторых странах респонденты бывают склонны рассматривать опрос как игру, в которой их роль состоит прежде всего в подыгрывании или поддакивании опрашивающему, возможно, даже в ущерб правильности ответов. Другой случай – это когда респонденты придают слишком большое значение изъявлению своей лояльности по отношению к властям и дают соответственно такие ответы, какие, как им кажется, от них ожидают услышать. Иногда, наконец, респонденты избегают признаваться в тех или иных своих реакциях, если последние идут вразрез с местными обычаями. В каждом из этих случаев особенности культуры вызывают смещения в ответах респондентов.

Как и другие аспекты проблемы эквивалентности, эта трудность может быть частично преодолена с помощью всестороннего анализа особенностей каждой страны, который помогает определить факторы, могущие влиять на ответы респондентов. Другой путь состоит в том, чтобы использовать при изучении некоторой проблемы несколько разных показателей. Ведь если результаты опроса подтверждаются и другими типами фактов, то это усиливает состоятельность выводов.

В этом очень кратком обзоре мы, конечно, не претендовали на перечисление всех источников данных для сравнительно-политологического анализа и всех связанных с ними проблем. Но из него видно, что у каждого источника есть свои сильные и слабые стороны, которые необходимо учитывать в любом сравнительном исследовании. [c.351]

ВЫВОДЫ

Мы начали эту главу с утверждения о том, что сравнительный анализ необходим тогда, когда мы ставим целью построить обобщение, верное для разных государств или [c.351] же когда мы изучаем явления системного уровня. При этом сравнительное исследование должно строиться в соответствии с целым рядом правил, касающихся правильного выбора исследовательского вопроса, эквивалентной меры, построения адекватной выборки и использования независимых результатов наблюдений. Почему мы делаем упор именно на эти правила? Потому что они помогают четко определить, что именно мы изучаем и можем получить в ходе исследования, и таким образом влияют на наши выводы в области политических отношений. Принимая в расчет нашу нынешнюю ограниченность как в теории, так и в источниках информации, нельзя, конечно, гарантировать совершенные решения по всем тем проблемам, которые могут возникнуть в ходе сравнительного исследования. И тем не менее всякий раз, как мы приступаем к анализу или к интерпретации его результатов, мы должны учитывать каждое из вышеизложенных правил. Чем яснее мы видим возможные искажения, тем больше у нас уверенности в том, что наши выводы – относительно социальных классов, участия населения в выборах, здравоохранения, форм социального протеста и пр. – правильны. [c.352]

12-лекция.ОБРАБОТКА ДАННЫХ

12. ПОДГОТОВКА И ОБРАБОТКА ДАННЫХ

Мы достигли той стадии исследовательского процесса, когда в нашем распоряжении уже имеется массив данных и предстоит выбрать наиболее доступный и эффективный способ его обработки. Именно на этой стадии мы начинаем окончательное оформление результатов наших усилий в виде схем, графиков, статистических выкладок и других элементов, составляющих отчет о проделанной научной работе; эту часть нашего исследования мы представляем для всеобщего обозрения и прочтения. Однако остается еще один гораздо менее заметный комплекс операций, которых нельзя избежать, если мы хотим извлечь из наших данных наиболее полную информацию. Имеется в виду подготовка и обработка данных, чему будет посвящена настоящая глава. Как исследователь приписывает цифровые значения той информации, которую он или она собрали, чтобы можно было бы ее основательно проанализировать? Как можно использовать эти цифры, чтобы осмысленно связаться с компьютером, без которого обрабатываемые нами массовые данные зачастую становятся неуправляемыми? Что в этом случае компьютер может сказать нам о наших данных? Как мы должны спрашивать его? Эти и другие имеющие отношение к делу вопросы должны быть решены прежде, чем мы перейдем к анализу данных и презентации результатов. [c.356]

КОДИРОВАНИЕ: ЧТО ВСЕ ЭТИ ЦИФРЫ ЗНАЧАТ?

Процесс присвоения количественных значений имеющейся у нас информации называется кодированием. Кодирование для измерений значит то же, что алфавит для речи, а именно средство, с помощью которого информации придается форма связного и продолжительного сообщения. Так же как каждая буква или комбинация букв алфавита представляет определенный звук, каждая цифра или комбинация цифр кода представляет определенную характеристику или состояние исследуемого объекта. И так же, как буквы позволяют тем, кто знает алфавит, оперировать сложными мыслями, цифры позволяют тем, кто [c.356] знает код, оперировать сложными понятиями в более сокращенной форме. Кроме того, цифровая кодировка дает возможность исследователю пойти еще дальше, поскольку кодированная информация, особенно кодированная в цифровой форме, позволяет применить математические методы, и тогда полученные данные могут выявить то, что без обращения к цифровой интерпретации могло остаться скрытым. Другими словами, кодирование открывает путь к более глубокому исследованию, чем это могло бы быть в любом другом случае.

Цифровые коды в исследовательской работе очень похожи на азбуку Морзе в телеграфии, с которой вы, вероятно, знакомы. В азбуке Морзе определенные комбинации точек и тире заменяют буквы алфавита. Сами точки и тире преобразуются в длинные и короткие звуки, которые могут быть переданы по радио от соответственно оборудованной передающей станции к соответственно оборудованному приемнику. Звуки затем преобразуются в буквы, и передача сообщения, таким образом, завершена. На рис. 12.1 этот процесс изображен в форме диаграммы.

Рис. 12.1. Кодирование в телеграфии

Точно также в научном исследовании каждая цифра кода означает определенную градацию данной переменной. Например, если мы измеряем уровень образования членов определенной группы, в которой каждый опрашиваемый может иметь незаконченную высшую школу, законченную высшую школу и законченное высшее образование колледжа, мы можем представить эти три уровня градаций цифрами 1, 2, 3. Или же, если мы хотим учесть число лет обучения, цифровой код должен отражать это число (например, цифра 7 будет значить семь лет обучения). Обе системы кодирования позволяют довольно точно подытожить результаты исследования, хотя принципы, кодирования разнятся. Ну и, поскольку мы имеем комплекс закодированных в той или иной форме данных, можно обрабатывать и анализировать их в соответствии с нашими желаниями, прежде чем преобразовывать их обратно в словесную форму при подготовке отчета о нашей нагнои деятельности. Этот процесс перевода информации из словесной формы в цифровую и обратно в обобщенной форме показан на рис. 12.2.

Рис. 12.2. Кодирование в исследовании

Самое главное, что необходимо помнить при разработке кодирования данных, – это то, что принцип [c.357] кодирования должен всегда определяться характером измерения исследуемой переменной. Так, переменные, измеряемые номинальными шкалами, должны иметь номинальные коды, переменные, измеряемые шкалами порядков, – порядковые, и переменные, измеряемые интервальными шкалами, – интервальные. Внешне все эти цифры могут казаться [c.358] одними и теми же, однако их значения в каждом случае существенно отличны от других. Анализ или оперирован данными, преобразованными из словесной формы в цифровую, чреваты непреодолимым искушением применить м годы, которые просто невозможны в данном случае в си особенностей измерения переменной (более подробно мы рассмотрим эту проблему в следующих главах). Такое искушение нужно преодолеть, если мы хотим извлечь пользу своего исследования. [c.359]

Механизм закодирования (или раскодирования) данных действительно очень прост. Мы начнем с определения типа каждой переменной нашего исследования с точки зрения шкалы ее измерения. Если это номинальная переменная, в которой нам нужно распределить цифры кода между взаимоисключающими категориями, невзирая на порядок их расположения, то мы делаем это так, как нам удобно. Возьмем довольно типичный пример. Если члены исследуемой группы подразделяются по вероисповеданию на протестантов, католиков и иудеев, то распределить коды между этими категориями можно согласно любой из нижеследующих схем:

1  Протестанты
2  Католики
3  Иудеи

1  Католики
5  Иудеи
8  Протестанты

1  Иудеи
2  Протестанты
3  Католики

43  Протестанты
17  Католики
27  Иудеи

В каждом случае отдельная цифровая градация используется для обозначения градации или категории переменной. Поскольку вероисповедание есть номинальная характеристика, порядок расположения и размерность кода не имеют никакого значения. Мы можем при кодировании использовать одно-, трех- и даже десятизначные цифры, если нам этого захочется. Конечно, лучше давать наиболее простые и удобные коды, и обычно выбирают простые цифры с наименьшим количеством знаков, но вообще это зависит от нашей приверженности к экономии, а не от каких-либо математических требований.

Можно также использовать более сложную схему номинального кодирования для более полного отражения информации. Например, мы хотим в нашем исследовании более подробно представить информацию о лицах протестантского и иудейского вероисповедания. Тогда мы можем использовать систему двузначных кодов, которая строится на предыдущей классификации. В качестве первой цифры выбираем ту же, что и ранее (например, 1 – протестанты, 2 – католики, 3 – иудеи). Вторая будет обозначать новую информацию. Взгляните на следующую схему:

10  Протестанты
11     Баптисты
12     Методисты
13     Просвитериане
14     Лютеране

20  Католики
30  Иудеи
31     Ортодоксальные
32     Консервативные
33     Реформистские

[c.360]

Здесь наши коды отражают (в первой колонке) приблизительную разницу между категориями и в то же время (вторая колонка) дают возможность уточнения. В результате мы имеем более полную запись характеристик исследуемых лиц, которая вместе с тем сохраняет следы менее точной (но зачастую более удобной с точки зрения анализа) системы записи, с которой мы начали.

Если бы нам нужно было перечислить все градации протестантского вероисповедания, то возможности кода в диапазоне “10” (от 10 до 19) вскоре были бы исчерпаны и нам пришлось бы изменить схему записи. Любой из нижепредложенных вариантов может легко решить эту проблему, хотя выбор того или иного пути может варьироваться в зависимости от задач исследовательского анализа или навыков компьютерного программирования.

В первом случае мы просто увеличили количество двузначных кодов (комплектов десятичных кодов), приписанных протестантам, тогда как во втором – упорядочили их. И опять если переменная, по сути, является номинальной, то ни конкретная цифра, ни количество знаков кода не имеют никакого значения. До тех пор пока наша система кодировки является оптимально экономной, а градации переменной – взаимоисключающими, любая цифра удовлетворительна. [c.361]

Когда мы кодируем порядковые переменные, наши возможности уже несколько ограничены. Поскольку порядковое измерение не предполагает равных или просто известных нам интервалов, мы остаемся, вольны в выборе цифр любой величины. Но поскольку порядковое измерение требует сохранения в наших кодах относительного ранжирования градаций (позиций), мы должны заботиться о том, чтобы наши цифры были по меньшей мере определенным образом расположены. Так, для переменной уровень политического развития или любой другой переменной, содержащей разницу в уровне, степени или сходстве градаций, любая из предложенных ниже систем кодировки может быть одинаково верной (и одинаково значимой).

1 Самый низкий
2 Низкий
3 Высокий
4 Высший

1 Самый низкий
6 Низкий
7 Высокий
9 Высший

1
17
24
3027

Самый низкий
Низкий
Высокий
Высший

Каждая из них сохраняет порядок, заданный самой переменной. И ни одна не является более точной, чем остальные, поскольку точность здесь – функция не самих цифр, а стоящего за ними порядкового измерения. Как и ранее, наша приверженность к экономии может подтолкнуть нас к выбору первой из трех предложенных схем, однако если не принимать этого во внимание, то наш выбор строго случаен.

Напротив, ни одна из следующих схем не является подходящей:

1 Самый низкий
9 Низкий
6 Высокий
7 Высший

1 Высший
2 Высокий
3 Низкий
4 Самый низкий

Если относительная величина или расположение цифровых кодов (а следовательно, и направление их изменения) не имеют значения для номинальных измерений, то в случае работы с порядковыми данными они очень важны. В первом из вышеприведенных примеров смещен порядок кодов, во втором он изменен на обратный. В результате ни одна из систем кодировки не сохраняет в достаточной мере относительного расположения и величины градаций самой переменной. Таким образом, коды неверно передают сведения. Они либо лишают нас возможности выстроить наши данные по порядку, либо вводят в заблуждение относительно причин [c.362] той систематизации, которую мы пытаемся выработать. Короче говоря, подобных ошибок нужно избегать при работе с порядковыми данными.

Разработка кодов для интервальных измерений, с одной стороны, – наиболее трудоемкий процесс, однако с другой – он может оказаться наилегчайшим. Здесь цифры имеют гораздо более точное значение, и наши возможности в кодировании существенно ограничены. Доллар – это доллар, год – это год, а разница между 47 и 43% такова же, как и между 73 и 69%. В интервальном измерении не только величины являются взаимоисключающими и определяющими порядок расположения, но и интервал между двумя соседними значениями одинаков и неизменен. Кодирование интервальных данных должно сохранять эти характеристики.

На первый взгляд это может показаться невыполнимой задачей. Для того чтобы закодировать интервальную переменную, необходимо найти такую систему кодов, где каждый исключает другие, каждый соответствует определенной величине переменной, каждый отстоит на равное количество единиц измерения от ближайшего соседа и дистанция эта между двумя соседними величинами известна. В действительности, однако, нахождение таких цифр, в общем-то, простая задача, поскольку в отличие от большинства номинальных или порядковых шкал, когда исследователь, по сути дела, вынужден выискивать цифровые эквиваленты для своих сведений, многие интервальные коды заданы изначально. Иными словами, интервальные коды гораздо чаще, чем на более низких уровнях измерения, следуют непосредственно из операционных характеристик самой переменной. Если определить личный доход как количество долларов, которое он или она зарабатывает за определенное время, то каждое конкретное количество заработанных долларов определяет не только какую-либо градацию переменной дохода, но и код для этой градации. Если градации номинальных и порядковых переменных в основе своей являются вербальными (как, например, протестант и католик, высокий и низкий уровни развития) и должны быть заменены цифровыми эквивалентами, то градации интервальных переменных изначально имеют цифровую форму (доллары дохода при исчислении стажа работы в административном [c.363] учреждении) и не требуют специального перевода. Результатом является то, что при кодировании интервальных данных основное внимание уделяется не созданию имеющих смысл кодов, а опознаванию и сохранению их.

Как отмечалось в гл. 3, иногда могут возникнуть такие ситуации, когда исследователь, желая повысить возможности обработки и информационную отдачу своих данных, захочет свести интервальные данные к порядковым категориям. Например, для нас гораздо проще и значимее может оказаться анализ респондентов по общему уровню их доходов, чем учет каждого доллара разницы. В таких случаях в первоначальной кодировке данных можно сохранить их интервальный характер, а затем полученные категории преобразовать согласно нуждам исследователя (например, мы записываем действительное количество долларов, заработанных респондентами, а затем группируем их в более крупные категории) или же можно действовать по методу, когда данные сразу, по мере поступления записываются в сгруппированном виде так, как будто мы классифицируем респондентов по большим категориям дохода и не фиксируем точный размер их заработка. Каждый метод имеет свои достоинства и свои недостатки, которые должны учитываться в каждом конкретном случае. Какой бы метод ни был взят, исследователь должен быть уверен, что выбранная схема кодирования отвечает требованиям измерения конкретного признака.

Становится очевидным, что процесс приписывания определенных кодов данным неотделим от процесса операционализации переменных. Безусловно, коды – это ничто иное, как цифровое выражение наших операциональных определений. Поэтому обсуждение проблемы кодирования было бы более уместно в начале книги. Все вопросы, связанные с тем, какие коды дать градациям переменных, должны быть решены на ранних стадиях исследовательского процесса. Все это неотъемлемая часть верного планирования исследования. Однако истинная ценность кодов становится понятной позже, поскольку именно на стадии анализа данных коды начинают играть ту роль, которую они призваны сыграть во всем проекте исследования. Именно тогда коды дают возможность перейти от обзора к обработке данных, а затем от обработки – к интерпретации. Для того чтобы понять, как происходит этот переход, давайте рассмотрим некоторые аспекты техники кодирования. [c.364]

КНИГА КОДОВ И КОДИРОВАЛЬНЫЙ БЛАНК

Первое, что нам следует рассмотреть, – это книга кодов. Книга кодов – это перечень всех переменных, встречающихся в исследовании, всех значений, которые могут принимать переменные, и всех приписанных им цифровых значений.

Представьте, например, что 1 июля 1995 г. правительства Ирана, Никарагуа и Вьетнама заключили соглашения с некоторыми рекламными агентствами с целью улучшения своего имиджа в американской прессе и что мы хотим провести исследование, для того чтобы определить, каково воздействие этих усилий на содержание новостей и редакционных статей. В таком исследовании нам можно сравнить период, непосредственно предшествующий, и период, непосредственно следующий за исходной датой, с тем чтобы установить, что произошло после заключения контрактов: 1) количество репортажей о каждой) стране значительно возросло или значительно упало, 2) отношение к этим странам в прессе более предпочтительно или менее предпочтительно, чем в предыдущий период. Необходимо также учитывать такие дополнительные факторы, как регулярные сезонные перемены в репортажах, например большее внимание прессы к некоторым странам в период туристского сезона, или увеличение потока достойных внимания прессы событий во время обострения политической ситуации или в результате стихийных бедствий; однако для большей наглядности мы не будем обращать внимание на эти факторы.

Для того чтобы оценить эффект усилий по улучшению имиджа, мы можем обратиться к любому количеству репортажей новостей или проанализировать лишь перечень, который может быть в форме как заголовков, так и кратких резюме различных статей и содержит, по сути дела, значительную долю информации; можно также использовать его лишь для обозначения самих статей. Для наглядности давайте воспользуемся перечнем (который в нашем случае содержит заголовки и полные библиографические ссылки) в “Reader's guide to Periodical Literature”, в котором публикуется содержание большого количества популярных журналов; выберем гуда заголовки “Иран”, “Никарагуа”, “Вьетнам”. Нашей зависимой переменной будет деятельность профессиональных рекламных агентств, точнее, ее отсутствие (до l июля 1995 г.) или присутствие (после этой даты). [c.365]

Следуя двум отмеченным принципам, мы будем иметь два комплекса зависимых переменных. В первом будет учитываться количество статей, в нем будет отмечаться ежемесячное количество их в период до и после тестирования и соотношение (на основании заголовка или содержания) статей, относящихся к политической, экономической или социальной системам каждой страны. В дальнейшем мы будем обозначать эти статьи как затрагивающие внутренние или внешние проблемы. Второй комплекс зависимых переменных будет учитывать качество репортажей на основании суждений о том, насколько положительно или отрицательно (опять же на основании заголовков) оцениваются в них названные страны. И, наконец, в любом исследовании такого рода необходимо иметь специальные коды для обозначения каждой отдельной статьи, страны, к которой она относится, даты публикации, объема статьи, типа издания, в котором она появилась.

В упрощенном виде макет кодировки для этого гипотетического исследования представлен в табл. 12.1. Как видите, макет кодировки суммирует переменные, используемые в исследовании, и приданные им значения. Это, по сути дела, немного больше, чем просто формальная классификация, с которой начинается любое исследование. Здесь эта классификация представлена во всех деталях, включая инструкции к интерпретации, и структура ее построена не в соответствии с нашими гипотезами, а с тем, чтобы облегчить сбор информации. Книга кодов обеспечивает постепенное продвижение к тому, что мы пытаемся выяснить, а также описание этого искомого, когда мы его нашли.

Эта “Книга кодов” идентифицирует компьютерные колонки, в которых будут храниться данные, а также предоставляет описания информации, которая должна быть найдена в определенном месте. Она также сообщает, какие коды были использованы для представления данных, не являющихся числовыми. Например, кодовая таблица, представленная в табл. 12.1, показывает, что номер 1, обнаруженный в компьютерной колонке 16, означает тип журнала, в котором была найдена искомая статья, а именно – еженедельник (как, например, “Time” или “Newsweek”). Такая организация информации помогает исследователю записывать данные правильно и аккуратно интерпретировать результаты анализа, после того как он закончен. А [c.366] тем, кто может использовать эти данные впоследствии, это также дает возможность увидеть, как организованы данные, и в свою очередь интерпретировать результаты анализа, не опираясь на уже существующее мнение.

Таблица 12.1.

Макет кодировки для исследования “Информационные агентства о некоторых странах”

Колонка	Переменная	Значение переменной	Код
1 - 4	Статья и номер кодирования		-
5	Государства	Иран Никарагуа Вьетнам	1 2 3
6 - 7	Месяц публикации	Июль 1995 Август 1995 … Январь 1996 … Май 1997 Июнь 1997	01 02 … 07 … 23 24
8	Отношение к политической системе в заголовке статьи (включая любое упоминание о политических деятелях, правительствах, политических событиях, оппозиционных партиях, политике и т.д.)	Не относится Относится	0 1
9	Отношение к экономической системе в заголовке статьи (включая любое упоминание о промышленности, экономике, денежном курсе, рабочей силе, продукции, экономических возможностях, рынке, торговле и т.д.)	Не относится Относится	0 1
10	Отношение к социальной системе в заголовке статьи (включая любое упоминание о культурных, религиозных и социальных институтах, событиях или деятелях и т.д.)	Не относится Относится	0 1
11	Посвящена внутренним или внешним проблемам	Заголовок статьи относится исключительно к внутренним объектам, действиям или событиям Заголовок статьи относится как к внутренним, так и к внешним объектам, действиям или событиям Заголовок статьи относится исключительно к вешним объектам, действиям или событиям Не связан с этим	1 2 3 9 [c.367]
12	Положительное или отрицательное отношение	Заголовок статьи касается исключительно прогресса, достижений, ресурсов, активов, мощи страны Заголовок статьи касается как прогресса, так и упадка страны Заголовок статьи касается исключительно упадка, бедности, долгов и слабости страны Не связан с этим	1 2 3 9
13 - 15	Количество страниц в статье		-
16	Тип журнала, опубликовавшего статью	Еженедельник новостей (включая только “Time”, “Newsweek”, “U.S. News and World Report”) Другие, в основном политические (включая журналы мнений и посвященные преимущественно общим или специальным политическим новостям и анализам) Другие, в основном неполитические (включая популярные журналы и специальные преимущественно неполитического профиля)	1 2 3

Разработка книги кодов облегчает быстрый переход к следующей стадии подготовки данных – созданию кодировального бланка. Кодировальный бланк – это лист записи данных в соответствии с книгой кодов и в форме, облегчающей компьютерную обработку собранной информации. Обзорная анкета и форма записи для структурированной информации, описанные в предыдущих главах, являются, например, вариантами кодировального листа, так же как и представленная на рис. 12.3 запись сведений в нашем исследовании репортажей о различных странах в американской прессе. [c.368]

Рис. 12.3. Кодировальный бланк для исследования “Пресса США о некоторых странах”

На рис. 12.3 в колонки занесены признаки книги кодов. На каждую цифру кода отведена специальная колонка; так, двухпорядковый код (такой, как у переменной месяц публикации) требует двух колонок в копировальном листе. Точно так же каждый ряд представляет отдельный случай и каждая цифра обозначает значение переменной в каждом конкретном случае. Так, мы видим, что под номером 0001 описана статья об Иране, которая появилась в еженедельнике новостей в январе 1996 г., посвящена исключительно политической системе и не содержит упоминаний об определенных затруднениях во внутренней ситуации. Этим характеристикам может отвечать, например, статья [c.369] из “Тайм”, озаглавленная “Иран в хаосе: руководители не в состоянии остановить казни, стабильность под угрозой”. И таким же образом могут быть записаны относительные характеристики заголовка любой статьи, которую мы встретим; при этом каждая статья (каждый отдельный случай) будет занимать один ряд или строку. И если мы изучим, или закодируем, 821 случай, то все данные займут всего 821 ряд. Данные разных случаев (статей), но относящиеся к одному и тому же признаку, будут записаны в одних и тех же колонках на кодировальном бланке. И, наконец, все кодировальные бланки следует пронумеровать (чтобы быть уверенным, что ни один из них не потерялся), датировать (даты часто бывают, полезны, например, если мы вынуждены изменить формулировку или добавить переменную в книгу кодов и приходится перекодировать или добавлять коды к предыдущему материалу) и подписать полным именем или инициалами кодировщика (это основа для измерения надежности интеркодирования, описанной в гл. 9). Если для каждого случая требуется больше одного кодировального бланка, например когда количество переменных, которые нужно измерить, достаточно велико, все бланки, относящиеся к одной группе случаев, следует скрепить и пронумеровать однотипно. Это сведет к минимуму шансы перепутать их при обработке. Имеет также смысл выносить порядковый номер каждого случая на отдельный копировальный бланк, используемый для него. [c.370]

КАК ОБРАБОТАТЬ ДАННЫЕ

Когда кодировка данных закончена, мы обращаемся к их обработке, с тем чтобы прийти к каким-либо выводам. Понятно, что в работе с большим количество случаев и переменных путаница может быть абсолютно непреодолимой. Если мы хотим преодолеть эту трудность и добиться максимальной простоты, точности и емкости анализа, нужно положиться на компьютер. Конечно, компьютер – очень сложная система, но ее основные принципы несложно понять.

Компьютеры состоят из комплектов выключателей (кнопок), которые используются для набора информации посредством простых кодов. Можно проиллюстрировать это, пользуясь аналогией с выключателями света в вашем [c.370] доме. Выключатель может выполнять только два типа операций. Он либо включен, либо выключен, посредством постановки в ту или иную позицию выключатель (и свет) могут быть использованы для передачи информации. Если, например, вы хотите, чтобы в канун Дня всех святых ваши дети навестили вас, вы информируете об этом, включая свет у дверей вашего дома. Если вы не хотите, чтобы вас беспокоили, вы не станете включать свет. По сути дела, вы передаете сообщение посредством замыкания и размыкания электрической цепи. Точно так же, сочетая комплекты выключателей и лампочек и используя двоичную систему исчисления (описанием которой мы сейчас не станем заниматься), вы можете составлять все более и более сложные информационные сообщения. Построение такой системы кодов по типу “да – нет” и использование ее для обмена информацией можно представить себе как программирование ваших действий с выключателями света. Собственно говоря, так компьютер и работает, конечно, в гораздо большем и более сложном масштабе. Обычный компьютер состоит из многих тысяч маленьких выключателей, запрограммированных на сбор и обработку информации точно таким путем.

Некоторые виды анализа – особенно такие, в которых задействованы очень большие объемы данных или очень сложные процедуры обработки, – производятся на компьютерах типа “мэйнфрейм”, но большинство политологических исследований могут быть сделаны и на достаточно быстрых персональных компьютерах с большой памятью. Для “общения” с компьютером мы используем различные средства – от пишущей машинки консоли до оптической “мышки” и светочувствительного пера. Информация, вводимая в компьютер с помощью клавиатуры (или какими-то другими средствами), конвертируется в электронные коды, которые хранятся в виде, предварительно оговоренном. Каждой строке информации соответствует строка в кодировочной таблице. Таким образом, продолжая разговор о нашем примере, чтобы ввести коды 821 статей о трех запрашиваемых странах, мы должны были напечатать их в 821 строке данных на клавиатуре.

Некоторые программы пригодны для проведения статистического анализа на персональных компьютерах. Они различаются по форме и возможностям. Одни – особенно [c.371] разработанные для компьютеров “Apple” или IBM совместимых систем, использующих программное обеспечение типа “Windows”, – ориентированы на визуальные (графические) команды. Другие – IBM совместимые системы, использующие операционную систему MS-DOS, – ориентированы на текстовые команды. Разнообразие аппаратного и программного обеспечения слишком велико, чтобы подробно рассматривать его на этих страницах. Однако что касается ввода данных, то в наиболее современных программах используется обычно формат, называющийся “электронные таблицы”^*.

При использовании электронных таблиц сначала необходимо пометить и определить значение колонок для ввода данных, установив параметры (число колонок, необходимых для каждой переменной, тип и определяющие метки). Затем производят ввод данных построчно, причем в каждой строке должен быть представлен отдельный случай или наблюдение. Соответствующие колонки заполняются цифрами или буквами. Все это выглядит достаточно знакомо, ибо процедура совершенно совпадает с созданием программного бланка (coding sheet), которое мы описали выше.

Когда данные введены в компьютер, их нужно обрабатывать. Это значит, что мы должны “проинструктировать” компьютер, каковы наши требования к их обработке. Какие случаи нам нужно проанализировать? Какие подсчеты должны быть выполнены? В какой форме мы хотим получить результаты?

Полезно уметь писать компьютерные программы, но нет никакой необходимости создавать свою собственную программу, для того чтобы проанализировать большинство данных, привлекаемых для политологического исследования. Пригодное для этого программное обеспечение включает в себя очень сложные и хитроумные программы, выполняющие разнообразные статистические, аналитические, текстовые и другие операции. Но даже если программы сами по себе сложны, то использовать их [c.372] очень легко. В каждой имеется своеобразная “поваренная книга” для обработки данных. Эта “книга”, или учебник, содержит пошаговые инструкции по использованию программы и выполнению определенных задач. В сущности, компьютер задает нам разные вопросы, посылая на экран сообщения типа: “Хотите ли вы, чтобы я вывел на экран эти данные в виде таблицы?” или “Вы хотите посчитать среднее квадратическое отклонение для этих случаев?” Следуя инструкциям, мы отвечаем “да” или “нет” и указываем на специфические процедуры, которые мы хотим проделать. Форма и суть этих инструкций меняются в зависимости от пакета, но в целом функции их одинаковы. Таким образом, на самом деле нет необходимости создавать программы, поскольку есть возможность пользоваться уже имеющимися в компьютере.

ВЫВОДЫ

В заключение хочется сделать еще три замечания. Во-первых, довольно распространено явление, когда люди, не имеющие прежнего опыта работы с компьютером, теряются и слегка побаиваются его. Такие чувства понятны, однако нельзя позволять им становиться препятствием в обучении. При наличии всех закрытых программ, руководств и консультационных служб, которые сейчас существуют, использование компьютера значительно облегчается по сравнению с прежними временами. Когда, наконец, вы преодолеете свои сомнения, то, возможно, обнаружите, что попались компьютеру “на крючок” и получите огромное удовольствие от общения с ним.

Во-вторых, не стесняйтесь ошибаться. Внимательный ввод данных и считывание предотвратят многие ошибки, И, как в любой новой сфере, вы вскоре найдете пути улучшения работы. Это – обычное дело. Если подумать, ошибки и их исправление – один из наиболее важных моментов обучения. Следите за своими ошибками там, где это возможно, не отказывайтесь от помощи там, где это необходимо, и не прекращайте своих попыток.

И наконец, не увлекайтесь. Компьютеры по природе своей бестолковы; они обрабатывают информацию, они точно следуют командам, но они не думают. Используя пакеты программ, которые мы здесь описали, вы можете с легкостью заставить компьютер выполнять сложнейшие статистические расчеты, какие только можно вообразить, данных такого низкого уровня, что результаты, несмотря [c.373] на впечатляющую внешнюю форму, будут бессмысленны. Соответственно, очень важно, чтобы вы заранее продумывали и понимали статистические и аналитические процедуры, которые предстоит осуществить компьютеру, и отбирали только те, которые соответствуют вашим данным. Эти процедуры будут предметом обсуждения нескольких следующих глав. [c.374]

13-лекция. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

Социальные и природные события в равной степени поддаются счету, и для сведения всего в природе к законам, подобным тем, которые открыл Ньютон с помощью дифференциального исчисления, все, что нужно, – это достаточное число наблюдений и развитые математические средства.

Маркиз де Кондорсе, ок.1790

Различие между международной политикой в ее нынешнем состоянии и производной от нее рациональной теорией подобно различию между фотографией и живописным портретом. Фотография отображает все видимое невооруженным глазом; живописный портрет отображает не все видимое невооруженным глазом, но зато он отображает – или по меньшей мере тщится отобразить – одну невидимую невооруженным глазом вещь: человеческую сущность изображенного на нем лица.

X. Дж. Моргентау, 1967

Математическая модель – это упрощенный вариант действительности, используемый для изучения ее ключевых свойств. Чарльз Лейв и Джеймс Марч дают такое определение модели: “Модель – это упрощенная картина реального мира. Она обладает некоторыми, но не всеми свойствами реального мира. Она представляет собой множество взаимосвязанных предположений о мире. Как и любая картина, модель проще тех явлений, которые она по замыслу отображает или объясняет”¹.

За прошедшее столетие математика стала широко использоваться в социальных науках и ныне применяется фактически во всех разделах политологии – от вопросов заключения контрактов на использование городского гаража до проблемы предотвращения ядерной войны.

Математическую модель можно во многих отношениях уподобить масштабной модели самолета или макету здания. У модели самолета или макета здания нет многих черт их полномасштабных прототипов: они меньше размерами, многие детали в них выполнены весьма неточно, и многие элементы внутреннего устройства настоящего [c.466] самолета или здания в модели отсутствуют. Но модель, тем не менее, очень полезна для исследователя тем, что она отражает фундаментальные свойства объекта-прототипа. Модель самолета может быть использована при испытаниях в аэродинамической трубе; картонный макет позволяет увидеть структуру здания во всех трех измерениях еще до его постройки. Модели социальных процессов выполняют похожую задачу, выявляя для изучения и экспериментирования ключевые признаки анализируемых процессов.

Первой из социальных наук в математическое моделирование оказалась сильно вовлеченной не политология, а, скорее, экономическая наука. В ней переход от словесных выражений к математическим был облегчен тем, что основной предмет ее интересов – деньги – уже изначально описывался с помощью чисел, и потому переход от счетоводства к математической экономической теории совершился почти без труда. Примерно тогда же и психология позаимствовала некоторые методы из биологии, которая в свою очередь переняла их у математической физики и химии. Таким образом, психология довольно рано стала пользоваться формальными методами для изучения особенностей поведения людей.

Политология шла по следам этих двух научных дисциплин, постепенно разворачиваясь в сторону количественных методик на протяжении 50 – 60-х годов. Ныне – если судить по тексту вводных курсов математического моделирования – по широте использования моделей социального поведения она уступает только экономике. Это может показаться удивительным, но политические процессы действительно обладают рядом особенностей, поддающихся математической обработке.

Начать с того, что многие политические решения содержат в себе значительный экономический компонент, а отсюда следует, что заметную роль в политологии должны играть модели, разработанные в рамках экономической науки. И экономические, и политические процессы включают в себя в качестве важной составляющей “рациональное” (т.е. целенаправленное) принятие решений в условиях неопределенности, конкретных ограничений и зачастую соперничества. Лучшим примером пересечения процессов принятия политических и экономических [c.467] решений может служить теория игр (см. ниже пример 2). Хотя политология на сегодняшний день заимствовала из экономики больше, чем экономика из политологии, разработчики экономических моделей начинают все больше осознавать необходимость введения в свои модели политических компонентов. Небезынтересно, что две Нобелевские премии по экономике были присуждены ученым (Кеннету Эрроу и Герберту Саймону), внесшим крупный вклад в развитие политической науки.

Деньги – не единственная интересующая политологов переменная, которая может описываться математически. Итоги голосования на выборах также приводятся в виде чисел. Военные приготовления обычно описываются в числовом выражении (число ракет, число танков и т.д.). В опросном исследовании политические мнения выражаются в виде процентных соотношений между различными группами респондентов. Вообще использование статистики в политологии опирается на математический фундамент. Шаг от просто количественного исследования к математической модели в этой области очень невелик.

Наконец, математическое моделирование не ограничивается операциями с количествами, оно может также иметь дело и с качественными характеристиками политического процесса. Некоторые политические процессы – такие, как принятие решений на выборах или распределение голосов избирателей, – могут быть определены полностью в математических терминах. В подобных случаях математические модели являются средством изучения логических следствий из наблюдаемых правил, и зачастую такие процессы оказываются куда более сложными, чем это можно было ожидать.

Математические модели помогают политологам с большей легкостью изучать особенности политических процессов. В нескольких уравнениях математической модели зачастую может быть заключен огромный объем информации. Во многих случаях возможна и компьютерная имитация политического процесса. Используя математические средства, политолог оказывается в состоянии взять на вооружение многие из методов, разработанных в логике, статистике, физике, экономике и других отраслях знаний, и применить их к изучению политического поведения. И наконец, [c.468] математические модели ясны и эксплицитны по форме и не оставляют недоговоренностей в том, что касается предполагаемых связей между явлениями. [c.469]

ПРОЦЕСС МОДЕЛИРОВАНИЯ

Математическое моделирование предполагает исследовательскую стратегию, несколько отличающуюся от стратегий тех основных форм политологического исследования, которые описаны нами в других главах, поскольку оно основывается одновременно как на индукции, так и на дедукции. Сейчас мы обсудим общий процесс построения модели, в суммарном виде изображенной на рис. 17.1.

Первый шаг при построении модели – индуктивный: это отбор наблюдений, относящихся к тому процессу, который [c.469] предстоит моделировать. Грубую аналогию этому шагу можно усмотреть в отборе переменных и исходной совокупности при проверке гипотезы, с той только разницей, что последняя операция обычно более формализована. Один из возможных путей представления такого начального шага состоит в формулировке проблемы, т.е. в принятии решения относительно того, что следует принимать во внимание, а чем можно пренебречь.

Это очень важно в отношении последующих мер, поскольку в том случае, если изучаемый процесс слишком сложен для методов, доступных исследователю, или если исследователь станет изучать некорректно определенные переменные, то работа по моделированию не слишком продвинется. Успех в поиске интересной, нетривиальной, неизученной и при этом решаемой проблемы зависит от сочетания различных факторов – удачи, интуиции и личного опыта исследователя; этот поиск подобен поиску интересной теории в том виде, как он был описан в гл. 2. Моделирование обычно предполагает меньшее число переменных, нежели проверка гипотезы: последняя оперирует простыми процессами (например, линейной регрессией), относящимися к большому числу переменных, тогда как в моделях используются сложные процессы, относящиеся к малому числу переменных.

Второй шаг заключается в переходе от определения проблемы к собственно построению неформальной модели. Неформальная модель – это набор таких инструментов, которые способны объяснить отобранные нами наблюдения, но при этом определены недостаточно строго и нельзя с точностью проверить степень их логической взаимоувязанности. К примеру, если объектом моделирования является гонка вооружений (см. пример 1), то неформальная модель могла бы выглядеть следующим образом: “Гонка вооружений происходит потому, что государства боятся вооружений, имеющихся у других государств; пределы ее ограничены стоимостью вооружений”. Это утверждение сообщает нам нечто о механизмах, движущих гонку вооружений, но для окончательного варианта модели оно недостаточно специфицировано.

На этой стадии большинство разработчиков моделей рассматривают целый ряд наборов неформальных допущений, способных объяснить одни и те же данные; тем [c.470] самым они рассматривают несколько потенциальных моделей и пытаются решить, какая из них лучше всего отображает изучаемую проблему. Иначе говоря, разработчик модели старается найти различные способы установления логического соответствия между моделью и реальным миром. Это критический момент в процессе моделирования. Если лежащая в основе модели неформальная теория несостоятельна, то ее не спасет никакое количество изощренных математических приемов.

Приобретя определенный опыт в моделировании, исследователь обычно переходит от неформальных моделей к поиску среди существующих формальных моделей такой, которая бы наиболее адекватно подходила к его наблюдениям. Формальная модель отличается от неформальной тем, что все допущения в ней сформулированы в математической форме. Существующие модели на самом деле представляют собой вполне конкретные наборы приемов, и, поскольку они уже кем-то изучались, возможные выводы из их исходных посылок уже известны, что придает определенное направление и дальнейшим разработкам.

Вместо того чтобы иметь дело с произвольным набором неформальных допущений, опытный разработчик будет стремиться рассуждать в терминах “игра с нулевой суммой”, “игра "дилемма заключенного"”, “разностное уравнение первой степени”, “модель Даунса” и других хорошо отработанных моделей. Опытный разработчик использует отработанные модели для того, чтобы от рассуждений типа “Для решения этой задачи необходимо иметь некоторое количество мелких металлических резцов, расположенных в ряд на плоскости и способных при возвратно-поступательном движении разрушать клеточную структуру древесины” перейти к рассуждениям типа “Здесь требуется пила”.

Третий шаг – это перевод неформальной модели в математическую модель. Такой перевод включает в себярассмотрение словесного описания неформальной модели и поиск подходящей математической структуры, способной отобразить те же самые идеи и процессы. Это, по всей видимости, самый сложный этап во всем процессе моделирования. Именно здесь могут вкрасться многочисленные ошибки и двусмысленности, поскольку в любом процессе перевода содержание одновременно и теряется, и расширяется. [c.471]

Стадия перевода может таить в себе две опасности. Во-первых, неформальные модели имеют тенденцию быть неоднозначными, и обычно существует несколько способов перевода неформальной модели в математическую, но при этом альтернативные математические модели могут иметь совершенно различный смысл. На самом деле это одна из главных причин, изначально толкающих нас к применению математических моделей: язык математики лишен двусмысленностей и более точен, чем естественный язык, он позволяет исследовать скрытый смысл тончайших различий в формулировках, который плохо доступен исследованию посредством естественного языка.

Вторая возможная опасность заключается в добавлении к неформальной модели тех имплицитных допущений, которые сопутствуют использованию конкретных математических методов. Это оказывается особенно существенным в тех случаях, где задействованы статистические методики и дифференциальное исчисление. Важнейшие формулы теории вероятности и дифференциального и интегрального исчисления опираются на несколько простых допущений, которые чрезвычайно полезны с математической точки зрения, но совсем необязательно соответствуют условиям политической и социальной жизни. Эти допущения в общих чертах соответствуют тому, что мы наблюдаем в мире природных явлений (и поэтому дифференциальное исчисление оказалось столь пригодным для моделирования самых различных природных процессов), но в том, что касается социального поведения, они отнюдь не всегда могут быть в равной степени применимы. Даже если некоторая конкретная модель была изначально рассчитана на отображение социальных ситуаций, тем не менее, надо постоянно учитывать наличие в ней имплицитных допущений и обращаться с ними с осторожностью.

Перевод неформальной модели на язык математики – это еще один элемент в моделировании, где важную роль играют личный опыт разработчика и его способность к взвешенным оценкам. Во многих случаях можно сэкономить массу времени и усилий, делая определенные допущения, позволяющие легче оперировать с моделью на стадии ее математической обработки; в других случаях те же самые допущения могут вызвать значительное отклонение модели от [c.472] исходной неформальной теории. В процессе моделирования приходится считаться с обеими этими сторонами перевода. Особенности математической модели могут подвести исследователя к подгонке под нее некоторых допущений неформальной теории. С другой стороны, если неформальная теория выглядит осмысленно, а математическая модель – нет, то следует испробовать какую-то иную математическую версию данной модели.

Например, если мы примем в качестве допущения, что причина, по. которой люди участвуют в голосовании, заключается в возможности оказать какое-то воздействие на результаты выборов посредством нарушения потенциальной случайной связи, а математический анализ показывает, что вероятность случайной связи настолько мала, что большинство избирателей в большинстве выборов только из-за этого голосовать не стали бы, то факт, что люди все-таки приходят на избирательные участки, означает, что мы, возможно, недооценили какие-то другие причины участия в голосовании, например чувство гражданской ответственности или желание выразить свое мнение. С другой стороны, наше математическое определение случайной связи, возможно, чересчур строго; может быть, люди рассматривают вероятность того, что в итоге выборов разрыв между кандидатами не превысит 1% общего числа голосов, как более чем случайную связь.

Следующий этап – этап математической обработки формальной модели – является решающим в математическом моделировании. Именно здесь применяется весь арсенал математических методов – логических, алгебраических, геометрических, дифференциальных, вероятностных, компьютерных – для формального вывода нетривиальных следствий из исходных допущений модели. На стадии математической обработки мы обычно – вне зависимости от сути задачи – имеем дело с чистыми абстракциями и используем одинаковые математические средства, идет ли речь о гонке вооружений или о подпрыгивании мяча. Этот этап представляет собой дедуктивное ядро моделирования, заключающееся в поиске нетривиальных и непредвиденных выводов из правдоподобных допущений.

Полученные выводы проходят через еще один процесс перевода – на сей раз с языка математики обратно на [c.473] естественный язык. Предосторожности, упомянутые нами в связи с переводом на язык формальной модели, сохраняют свое значение и здесь: ведь перевод с неизбежностью влечет за собой потерю и добавление какой-то информации и каких-то допущений. Этот заключительный перевод может оказаться едва ли не самым трудным этапом в процессе моделирования – как часто, глядя на ряд уравнений или графов, задаешься вопросом: “Что же это все может означать?” Хотя разработчик модели в целом заинтересован в получении вполне определенного результата, имеющего вполне определенный реальный смысл, но моделирование нередко порождает и неожиданные результаты, которые могут быть даже более интересными, нежели изначально ожидавшиеся. Литература по моделированию полна примеров того, как исследователь, взяв модель, разработанную кем-то другим, получил из нее интересные, не предвиденные ее автором результаты. Например, феномен “циклического голосования” (т.е. ситуации, когда три или четыре предложения голосуются по принципу простого большинства и при этом ни одно из них не может перевесить все остальные в случае попарного голосования) был известен как математический курьез с XVIII столетия. И только в 50-х годах нашего века стало ясным его значение; это произошло после того, как Кеннет Эрроу применил его в своей “теореме невозможности”, демонстрирующей существование некоторых фундаментальных противоречий во всех демократических избирательных системах.

Далее исследователю нужно вернуться назад к первоначальным стадиям моделирования, с тем чтобы внести в модель определенные уточнения. Соответствуют ли полученные выводы тому, что от модели ожидалось изначально? Имеют ли эти выводы смысл в свете эмпирических наблюдений? Если да, то можно ли усовершенствовать модель так, чтобы получить и другие нетривиальные выводы? Можно ли ее сделать более общей? Можно ли получить те же выводы при более простом наборе исходных допущений? Если модель не несет в себе реального смысла, то, что было неверным – формальная модель или же исходная концептуализация? А может быть, какие-то имплицитные допущения помешали правильному переводу с языка неформальной теории на математический язык? В процессе моделирования эти вопросы следует держать в уме постоянно. К формальному [c.474] сравнению и уточнению модели можно возвращаться много раз, прежде чем станет возможной эмпирическая проверка, которая выступает в качестве окончательного этапа моделирования, необходимого для установления степени обоснованности модели.

Эмпирическая проверка бывает нужна не всегда: в некоторых случаях исходные предположения описывают процесс исчерпывающим образом (это относится, например, к правилам избирательной процедуры), и выводы модели в проверке не нуждаются. Но обычно исходные допущения содержат факторы, в теоретической разработке модели полностью не специфицированные и нуждающиеся в оценке с опорой на фактические данные. Поскольку реально все модели социальных процессов предполагают значительный элемент случайности, эмпирические тесты помогают установить также и предсказательную силу модели. Проверка модели включает в себя те же самые этапы операционализации, измерения и статистического анализа, которые обсуждались нами в других главах, хотя для проверки математической модели нередко требуется определенная адаптация стандартных статистических методик. [c.475]

ЗАЧЕМ НУЖНЫ МОДЕЛИ?

Как указывалось выше, существует множество причин, в силу которых политологи прибегают к использованию математических моделей. Однако у данного метода есть и недостатки и преимущества. Моделирование – это процесс упрощения и дедуктивного вывода. Упрощение влечет за собой потерю информации о событии. Дедуктивный вывод зачастую включает в себя сложную математическую обработку, которая, по крайней мере на первых порах, затрудняет работу с моделью. Поэтому в отношении моделирования возникает резонный вопрос: а для чего нужны все эти сложности?

Первая причина, побуждающая нас к моделированию политического поведения, состоит в том, что модель помогает формализовать происходящие в обществе события. Дело в том, что политическая жизнь достаточно регулярна, для того чтобы упрощенная неформальная модель ее могла принести определенную пользу. Большая часть того, что случается в области политики, как правило, не [c.475] является совсем уж неожиданным – на самом деле наличие элемента неожиданности указывает на то, что у нас имеются априорные представления о том, как могут развиваться события, и мы в состоянии осознать факт неожиданного поворота дел. Значит, у нас в мозгу имеются своего рода ментальные модели функционирования политических систем, даже если мы ни разу не пытались выразить их эксплицитно. Математические модели как раз и помогают эксплицировать подобные неформальные модели.

В качестве примера ментальной модели можно привести следующий. Предположим, что на предстоящих президентских выборах один из кандидатов набирает 95% всех голосов. Очевидно, что это никак не противоречит ни конституции, ни устоявшимся избирательным процедурам. Однако мы будем склонны рассматривать такой факт как крайне маловероятный в силу целого ряда причин. Во-первых, мы допускаем, что со стороны каждой партии наберется достаточное число избирателей, чтобы свести к минимуму возможность чисто случайного результата голосования. Во-вторых, мы исходим из того, что ни одна партия не станет выставлять столь непопулярного кандидата, чтобы он мог собрать лишь 5% голосов. В-третьих, мы полагаем, что подсчет голосов производится без подтасовок. Можно было бы перечислять и далее, но суть в том, что относительно политической системы США у нас имеется целый ряд исходных допущений, в свете которых разбиение голосов на 5 и 95% представляется нам малоправдоподобным.

Все подобные допущения упрощают действительность. Мы не знаем, каково точное число избирателей, да нам это и не надо – мы просто знаем, что оно очень велико. Мы не знаем, какие конкретно особенности кандидата делают его приемлемым для одних избирателей и неприемлемым для других, но мы исходим из того, что совсем уж непопулярные кандидаты не будут выдвинуты на голосование. Мало у кого есть личный опыт в деле подсчета голосов, достаточный для того, чтобы знать, честно ли проводятся выборы, но весь опыт прошлого дает основания считать, что фальсификации на выборах места не имеют². Поскольку эти допущения не столь уж часто приводят нас к неверным выводам, мы можем использовать эту модель [c.476] политической системы для неформального прогнозирования будущего. В действительности те случаи, когда какой-либо кандидат получает 95% голосов, вызывают у населения сильное недоверие, иногда вплоть до требований о расследовании, так что наша модель отчасти определяет также поступки и отношения людей.

Другой причиной применения математического моделирования является необходимость эксплицитно описать механизмы, объясняющие наши неформальные прогнозы. Несмотря на то, что все индивиды знают, чего можно, а чего нельзя ожидать от данной политической системы, они зачастую не в состоянии определить точно, почему и что конкретно они от нее ожидают. Формальная модель как раз и помогает преодолеть чересчур свободные формулировки допущений неформальной модели и дать точный, а подчас и поддающийся проверке прогноз.

Вышеприведенный пример выводится из модели Даунса, которую мы будем рассматривать ниже в данной главе. Формальная модель Даунса предсказывает, что любая политическая партия в условиях альтернативных выборов будет выбирать своих кандидатов и платформу так, чтобы привлечь с их помощью как можно большее число избирателей. Это и некоторые дополнительные соображения приводят нас к заключению, что существует тенденция, в соответствии с которой политические партии должны получить на выборах примерно равное число голосов; именно такой исход обыкновенно и наблюдается на выборах в США. Таким образом, данная формальная модель предсказала не только то, что исход с распределением голосов в соотношении 95:5 является маловероятным, но и то, что ожидаемым будет распределение в соотношении 50:50, в пользу чего было приведено определенное обоснование.

Порой, кажется, что математические модели всего лишь подтверждают и так очевидные вещи. На самом деле это неотъемлемая особенность любых моделей постольку, поскольку от них ожидается, что они в той или иной степени должны воспроизводить все происходящее в каждодневной политической реальности. Однако люди, как правило, очень смутно представляют себе, что такое “очевидное”. Рассмотрение ряда противоречащих друг другу афоризмов (“волк волка чует издалека” и “крайности сходятся”, “с [c.477] глаз долой – из сердца вон” и “чем дальше с глаз, тем ближе к сердцу” и т.п.) убеждает нас в том, что здравый смысл часто оказывается правильным именно потому, что он настолько расплывчат, что попросту не может быть неверным.

Строгость формальных моделей, напротив, означает как раз то, что они могут быть неверными, и в результате у модели “спортивные показатели” могут быть подчас хуже, чем у более неоднозначного здравого смысла. Однако это вовсе не слабость, а, наоборот, достоинство моделирования, ибо допущения и прогнозы модели оказываются достаточно точными, чтобы их можно было проверить, а также указать, в каком месте и как произошла возможная ошибка. Та модель, которая устояла против целого ряда попыток ее искажения, вполне вероятно, и в будущем будет давать правильные прогнозы. Модель же, которая раз за разом дает неверные предсказания, видимо, должна быть устранена из рассмотрения.

Короче говоря, модель бывает полезной только в том случае, если в принципе, возможно, продемонстрировать ее ошибочность. Если невозможно показать, что модель неверна, то невозможно также доказать, что она верна, а отсюда следует вывод о бесполезности такой модели. Неформальная интуитивная модель, позволяющая уходить от всевозможных ошибок, может быть большим тактическим подспорьем на переговорах, но она бессильна помочь нам яснее понять механизм политического поведения.

Третьим преимуществом формальных моделей, но сравнению с голой интуицией или даже с тщательно обоснованной аргументацией на естественном языке является их способность систематически оперировать с сущностями более высокого уровня сложности. Естественные языки (подобно английскому) возникли как средства общения, а не как средства логического вывода. Математика, напротив, изначально была задумана как средство логического вывода и систематического оперирования понятиями. И опыт показал, что математика в этом отношении – очень полезное орудие. Политологи со своей стороны только сейчас начинают осознавать, что может дать моделирование для более углубленного понимания политического поведения, а в ряде случаев должны были развиться целые отрасли математики (самый заметный пример – [c.478] теория игр), прежде чем обществоведы смогли увидеть нечто общее в разрозненных типах социального поведения. Математическое моделирование социального поведения насчитывает не более 20 лет от роду, и пока нет оснований считать, что оно уже достигло пределов своего развития.

И наконец, преимуществом математического моделирования является также то, что оно позволяет различным научным дисциплинам обмениваться своими исследовательскими средствами и приемами. Тому можно привести много примеров: в моделях, используемых в политологии, задействованы не только основные математические средства, но и масса методик, заимствованных из эконометрики, социологии и биологии. Опросное исследование – представляющее собой, по сути дела, сложную математическую модель распределения общественного мнения между различными группами населения – является широко распространенным методом, используемым в большинстве социальных наук. Заимствование происходит и в обратном направлении: специалисты по системотехнике, разрабатывая крупные компьютерные модели глобальных социально-демографических процессов, для уточнения политических аспектов были вынуждены обратиться к политологическим моделям, а совсем недавно математики, работающие над новой теорией хаотического поведения, обнаружили, что модель Ричардсона гонки вооружений (см. пример 1) поддается весьма продуктивному анализу с применением методов вышеупомянутой теории. Подобным же образом и теория игр была изначально разработана экономистами и политологами для анализа явления конкуренции и лишь впоследствии превратилась в раздел чистой математики.

Помимо стимулирования междисциплинарного обмена методами и идеями, математические модели полезны также тем, что позволяют увидеть глубинную однородность явлений, которые на первый взгляд не имеют между собой ничего общего. Следующий пример, сам по себе довольно тривиальный, наглядно демонстрирует такой тип обобщения.

Представим себе нехитрую игру, в которой два игрока по очереди берут со стола фишки, пронумерованные от 1 до 9:

1 2 3 4 5 6 7 8 9

[c.479]

Выигрывает тот, кто первым наберет фишек на сумму, равную 15. Играя в эту игру, вы, несомненно, обнаружите, что в ней есть свои приемы – в частности, в порядке защитного приема вы можете забирать со стола именно те фишки, которые нужны второму игроку для получения окончательной суммы, – однако общая стратегия игры, по-видимому, не совсем очевидна. Чтобы обобщить игру, перепишем номера фишек следующим образом:

4
3
8

9
5
1

2
7
6

Заметим, что в такой записи каждая строка, столбец и диагональ в сумме дает желаемый исход – 15. Таким образом, для успешной игры нужно выбрать какой-то один из этих рядов чисел. В такой форме игра выглядит уже очень знакомо: это “крестики-нолики”, в которые умеет играть любой пятилетний ребенок. После того как мы представили игру в упорядоченном виде, то, что сначала нам казалось незнакомым, теперь стало выглядеть вполне узнаваемо, так что мы получили возможность использовать в новом контексте издавна известное нам решение.

Это упражнение – конечно, в более сложных формах и применительно к более значимым задачам – весьма характерно для процесса нахождения общих черт с использованием математических моделей. Известно множество случаев, когда математическая модель, разработанная изначально в расчете на одну какую-то проблему, оказывалась равным образом применимой и к другим проблемам. К примеру, модель Ричардсона гонки вооружений может быть использована для изучения не только международной гонки вооружений, но и динамики роста предвыборных расходов соперничающих политических партий или процесса взвинчивания участниками аукциона цены на “лакомый” товар. Игра “дилемма заключенного” применима не только к примеру позиционной войны (см. ниже), но и к случаю “войны цен” между двумя бензозаправочными станциями, а также к случаю принятия государством решения о необходимости разработки нового вида оружия. Разновидность игры “дилемма заключенного” под названием “цыпленок” берет свое начало от игр юных головорезов, носившихся в разбитых колымагах по заброшенным дорогам Калифорнийской пустыни; она теперь [c.480] применяется к изучению политики ядерного сдерживания в условиях угрозы термоядерной войны. Перечислять примеры можно было бы до бесконечности; для нас, однако, существенно, что большинство хороших математических моделей находят применения, далеко выходящие за рамки тех проблем, ради которых они первоначально разрабатывались.

Итак, математические модели имеют четыре потенциальных преимущества по сравнению с естественно-языковыми моделями. Во-первых, они упорядочивают те ментальные модели, которыми мы обычно пользуемся. Во-вторых, они лишены неточности и неоднозначности. В-третьих, математическая запись в отличие от естественно-языковых выражений позволяет оперировать на очень высоком уровне дедуктивной сложности. И, наконец, математические модели способствуют нахождению общих решений для проблем, кажущихся на первый взгляд разнородными. [c.481]

ПРИМЕРЫ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ПОЛИТИЧЕСКОГО ПОВЕДЕНИЯ

Нижеприведенные примеры отбирались нами так, чтобы лучше очертить границы применения математических моделей политического поведения, а также чтобы познакомить читателя с наиболее распространенными моделями. В каждом из этих примеров обсуждается только часть возможных следствий модели, поскольку каждой модели посвящены без преувеличения сотни исследований.

Пример 1. Гонка вооружений (модель Ричардсона)

В 1918 г. английский метеоролог Льюис Ф. Ричардсон, служивший на фронте санитаром, вернулся с первой мировой войны потрясенный размерами виденных им разрушений и насилия. Он был преисполнен решимости применить свои недюжинные математические способности и новейшие научные знания к изучению феномена войны. Поскольку первой мировой войне предшествовала гонка вооружений, Ричардсон обратился к рассмотрению этого явления. Благодаря своим занятиям физикой он был хорошо знаком с дифференциальным исчислением, используемым при моделировании динамических процессов. Гонка вооружений, рассуждал он, тоже является [c.481] динамическим процессом и может быть приблизительно описана с помощью математической модели.[c.482]

Испробовав десятки сложных математических формул, Ричардсон, в конце концов, остановился на относительно простой модели, учитывающей действие всего лишь трех факторов. Первый из них состоит в том, что государство Х ощущает наличие военной угрозы со стороны противника – государства Y. Чем большим количеством вооружений располагает Y, тем больше вооружений захочет приобрести X в ответ на воспринимаемую им угрозу. Однако в то же самое время государство Х вынуждено решать и насущные социальные задачи, и не может перевести всю свою экономику на рельсы военного производства. Следовательно, чем большим количеством вооружений располагает X, тем меньше дополнительных вооружений оно сможет приобрести из-за существующего бремени расходов. И, наконец, по рассуждению Ричардсона, существуют и прошлые обиды, влияющие на общий уровень вооружений. Та же самая логика, которая применима к государству X, действует и в отношении государства Y, для которого составляется сходное уравнение. С математической точки зрения все это рассуждение сводится к двум уравнениям:

X_t₊₁ = kY_t– aX_t + g,
Y_t₊₁ = mX_t – bY_t + b.

Члены уравнений X_t и Y_t обозначают величины уровней вооружений в момент времени t, X_t+₁ и Y_t₊₁ – в момент времени t+1. Коэффициенты k, т, а и b все являются положительными величинами, a g и h – положительными или отрицательными в зависимости от того, насколько в целом враждебно или дружественно настроены государства X и Y по отношению друг к другу. Величина угрозы отражена в членах kY_t и mX_t, поскольку, чем больше эти числа, тем больше количество вооружений у противной стороны. Величина расходов отражена в членах – aX_t и bY_t, поскольку за счет этих членов снижается уровень вооружений в следующем году. Наконец, константы g и h отражают величину прошлой обиды, которая в рамках данной модели считается неизменной.

Красота модели Ричардсона заключается в ее автономности: если вам известны значения коэффициентов и уровни вооружений государств Х и Y в одном каком-то [c.482] году, вы можете с помощью этой модели предсказать величину уровня вооружений в любом последующем году. Это придает модели способность – во всяком случае, в теории – прогнозировать будущее, и Ричардсон надеялся, что если политики смогут предсказывать приближение войны, то они смогут научиться и предотвращать ее.

На удивление оригинальная работа Ричардсона пребывала в безвестности в течение ряда десятилетий. Он продолжал свои исследования в области математизации международных отношений вплоть до самой пенсии, но работа его не получила признания ни в научных, ни в политических кругах. Ричардсон умер в 1953 г., будучи хорошо известен своими работами по математической метеорологии, но совершенно неизвестен в области политической науки.

Второе рождение работы Ричардсона наступило после того, как в конце 50-х годов ее обнаружила и стала всячески рекламировать группа социологов из Чикагского и Мичиганского университетов. Журнал “Journal of Conflict Resolution” посвятил Ричардсону целый выпуск. Были опубликованы две рукописи Ричардсона – “Статистика непримиримых распрей” и “Вооружение и отсутствие безопасности”, – и его модель стала краеугольным камнем новой области знаний – математической теории международных отношений. К началу 70-х годов модель была испробована уже сотни раз на самых разных вариантах гонки вооружений.

Модель работала! Не идеально, конечно: ведь любая гонка вооружений имеет сложный комплекс причин, совокупность которых не в состоянии охватить ни одна искусственная модель. Однако модель Ричардсона в целом эффективна в случаях краткосрочных прогнозов, и – что существенно – лучше нее не работает никакая другая автономная модель. Касается ли это противостояния между НАТО и Организацией Варшавского Договора, ближневосточного конфликта или трагической 30-летней войны в Юго-Восточной Азии, модель Ричардсона гонки вооружений всякий раз адекватно отражает основные особенности конкретного варианта гонки вооружений. При этом эмпирически обнаружилась еще одна область применения данной модели.

Одной из важнейших характеристик модели Ричардсона является стабильность. В простейшей форме стабильность [c.483] определяется тем, какими – ускоренными или замедленными – темпами развивается гонка вооружений³. На рис. 17.2. показаны два примера гонки вооружений: стабильной гонки вооружений между странами НАТО и ОВД и нестабильной между Ираном и Ираком; на обеих схемах размеры военных расходов приведены согласно данным ежегодников Международного института мирных исследований в Стокгольме (SIPRI). В случае нестабильной гонки вооружений, проблема предотвращения войны была, конечно, тем главным стимулом, который с самого начала подтолкнул Ричардсона к его разработкам. Оказалось, что его модель умеет очень хорошо предсказывать войну, поскольку почти всем современным войнам предшествует нестабильная гонка вооружений. Ричардсон постулировал это в своей основополагающей работе, а впоследствии это было подтверждено другими, более систематическими исследованиями.

В конце 70-х годов Майкл Уоллес обнаружил, что нестабильность гонки вооружений тесно коррелирует с войной. Используя несколько более сложное, однако, основанное на Ричардсоновой модели определение гонки вооружений, Уоллес обнаружил, что из 28 серьезных международных конфликтов, сопровождавшихся гонкой вооружений [c.484] в период с 1816 по 1965 г., целых 23 завершились войной. А из 71 конфликта, не вовлекавшего гонки вооружений, только три перешли в войну.

Другой иллюстрацией того же положения может служить следующий пример. В 1976 г. У. Лэдд Холлист, опираясь на модель Ричардсона и данные SIPRI о военных расходах, изучал четыре случая гонки вооружений: между СССР и США, между Индией и Пакистаном, между Ираном и Ираком и между Израилем и Египтом в период с 1948 по 1973 г. Из всех четырех случаев стабильной была только гонка СССР – США, что представляло своего рода проблему, и вот почему. Ведь гонки Индия – Пакистан и Израиль – Египет, будучи нестабильными, закончились войной, как и предсказывала модель; гонка СССР – США, будучи стабильной, не перешла в войну опять же в соответствии с предсказанием модели. Однако между Ираном и Ираком велась нестабильная гонка вооружений, а войны не было. Эта неувязка разрешилась в 1980 г., четыре года спустя после публикации статьи Холлиста, когда долго тлевший конфликт между Ираном и Ираком, наконец, разразился войной. Ирано-иракская гонка вооружений была стабильной до конца 60-х годов и лишь в 70-х годах превратилась в нестабильную, что дополнительно сужает тот период времени, когда, согласно предсказанию, могла случиться война.

Модель Ричардсона – это только один из представителей очень большого класса динамических моделей, т.е. таких, которые моделируют развитие некоторого процесса во времени. Многие из этих моделей реализуются в виде дифференциальных уравнений, а многие заимствуют математический аппарат из моделей демографического роста и других биологических процессов. Еще более сложными являются динамические компьютерные имитационные модели, которые моделируют сложные процессы с помощью больших систем уравнений, не поддающихся решению алгебраическими средствами. Объектами компьютерных имитационных моделей зачастую являются целые государства или глобальные политические и экономические системы, и эти модели все чаще используются для проигрывания сценариев типа “что будет, если…”, затрагивающих различные сюжеты внутренней и международной политики. [c.485]

До недавнего времени большинство динамических моделей, изучавшихся в политологии, отражали систематические, “правильные” процессы. В последнее десятилетие значительная работа проделана по “хаотическим моделям”, которые являются более сложными, чем модель Ричардсона и не имеют случайных компонентов, но во временном отношении генерируют поведение, которое кажется случайным. Динамический хаос может служить объяснением того, как постоянный политический процесс порождает в высшей степени нестандартное, “неправильное” поведение, например, гражданскую войну или парламентскую нестабильность.

Пример 2. Игра “дилемма заключенного”

Одна из наиболее развитых областей математического моделирования социального поведения называется теорией игр. “Игры” в рамках данной теории – это ситуации, в которых два (или более) участника делают выбор в отношении своих действий и выигрыш каждого участника зависит от совместного выбора обоих (всех). Примерами этого типа ситуаций могут служить такие традиционные игры, как шахматы, покер и футбол, поскольку исход их зависит от совокупных действий игроков. Игры, изучаемые теорией игр, обычно более формализованы, чем традиционные, и вознаграждения в них представляют собой не просто выигрыш или проигрыш, а нечто более сложное, но принцип соревнования и здесь и там один и тот же. Теория игр была разработана во время второй мировой войны и изначально рассматривалась как секретное оружие, однако с той поры она давно превратилась в самостоятельную отрасль математики.

Теория игр первоначально разрабатывалась на материале одного из типов соревнования, который носит название игры с нулевой суммой и заключается в том, что, сколько один игрок выигрывает, столько же другой проигрывает. К этой категории принадлежит большинство обычных игр, а также некоторые из “игр”, с которыми мы встречаемся в области политики, например выборы.

Однако большая часть политических ситуаций являются играми с ненулевой суммой, или кооперативными, когда оба игрока при определенных условиях могут [c.486] оказаться в выигрыше (т.е. тот факт, что один из игроков выиграл, вовсе не означает, что другой столько же проиграл). Из кооперативных игр лучше всего изучена игра “дилемма заключенного”, вариант которой разбирается ниже.

Представим себе ситуацию позиционной войны во время первой мировой войны. Солдаты британских и германских войск сидят в окопах друг против друга, разделенные только нейтральной полосой, а снайперы на брустверах выжидают, когда какой-нибудь неосторожный солдат встанет на секунду во весь рост в обстреливаемом месте, чтобы убить его. В самом начале подобного патового положения потери обеих сторон от снайперских выстрелов велики, и обе стороны чувствуют себя скованно и неуютно, будучи полностью привязанными к окопам. Но со временем, когда одни и те же подразделения неделю за неделей привыкают друг к другу, урон от снайперских атак начинает сходить на нет, постепенно приобретая характер просто несчастного случая. Посторонние наблюдатели, посещающие линию фронта, бывают удивлены, видя, как с обеих сторон солдаты расхаживают не таясь, совершенно без всякого прикрытия и никто никого не пытается при этом убить. Это совсем непохоже на то, как изображают войну в кино, и такое положение бесит некоторых офицеров, но “сотрудничество” становится правилом, и те неопытные офицеры, которые стараются заставить солдат нарушить это правило, имеют скверное свойство погибать от несчастного случая. Надо заметить, что подобное неформальное перемирие происходит без каких-либо открытых договоренностей между враждующими сторонами.

Вышеописанное представляет собой вовсе не плод выдумки пацифиста, а реальную ситуацию. Роберт Аксельрод приводит такую цитату из мемуаров британского офицера, участвовавшего в первой мировой войне: “Я пил чай в компании, когда мы услышали крики и вышли наружу узнать, в чем дело. Мы увидели, как германские и наши солдаты стоят друг против друга на своих брустверах. Внезапно рядом разорвался снаряд, но не причинил никому вреда. Естественно, обе стороны поспрыгивали в окопы, и наши стали ругать немцев, и вдруг один смелый немец вскочил на бруствер и крикнул: "Нам очень жаль, мы надеемся, никто не пострадал. Это не наша вина, это проклятая прусская артиллерия!"”⁴.

Это явление может быть объяснено с помощью очень широко применяемой модели под названием игра [c.487] “дилемма заключенного”. В “дилемме заключенного” обе стороны стоят перед выбором: либо сотрудничать друг с другом, либо друг друга обманывать. В том примере, который мы привели, платежная матрица (в терминах количества человек, убиваемых ежедневно) могла бы выглядеть так, как это показано в табл. 17.1. В этой матрице выплаты приводятся в таком порядке: британская сторона, германская сторона – и обозначают среднее число солдат, убиваемых за день.

Таблица 17.1

Британская сторона

Германская сторона

Сотрудничество

Обман

Сотрудничество
Обман

Клетка 1 –1, –1
Клетка 3 0, –10

Клетка 2 –10, 0

Клетка 4 –3, –3

Стратегия сотрудничества означает отсутствие намеренных попыток убить солдата противной стороны; стратегия обмана означает наличие таких попыток. Если обе стороны сотрудничают (клетка 1), то мы принимаем потери за величину случайную, что в среднем может выражаться в гибели одного солдата в день с каждой стороны. Если обе стороны намеренно ведут снайперский отстрел (клетка 4), то смертей будет больше, но ненамного, потому что обе стороны будут укрываться в окопах и не станут выставляться в качестве мишеней. И, наконец, если одна сторона начинает вести снайперский отстрел, в то время как другая занимается сотрудничеством (клетки 2 и 3), то та сторона, которая пытается сотрудничать, понесет значительные потери, а другая предположительно будет готова к отпору и вообще не понесет потерь в этот день.

В “дилемме заключенного” интересно то, что, чем хуже каждая из сторон думает о другой, тем скорее обе они примут стратегию обмана. Если одна из сторон выбирает сотрудничество, то наихудший исход (10 смертей) может ожидаться тогда, когда другая сторона в ответ выберет обман. Если одна из сторон выбирает обман, то неблагоприятный исход ожидается и тогда, когда другая сторона так же выберет обман, но это приведет всего лишь к трем смертям. Поэтому если выбирать из худших исходов [c.488] наилучший (это называется минимаксным решением), то надо обманывать. Но при этом следует учитывать, что если бы обе стороны сотрудничали, то обе они были бы в большем выигрыше, нежели в случае взаимного обмана (то есть теряли бы каждая по одному солдату в день). В этом заключается дилемма выбора.

Приведенный пример – это всего лишь один случай из очень большого числа ситуаций, к которым применима игра “дилемма заключенного”⁵. Другие стандартные примеры – это: обоюдный контроль над вооружениями, контроль за выполнением деловых контрактов, взаимный контроль государства и фермеров за ценами на продовольствие, соблюдение картельных соглашений, принятие решения о начале войны обычного типа и даже совместное решение студентов не готовиться особенно усердно к экзамену (поскольку требования, предъявляемые к отдельному ответу, обычно зависят от общего уровня ответов).

В отношении “дилеммы заключенного” наиболее интригующим представляется то обстоятельство, что в реальной действительности игроки чаще выбирают сотрудничество, несмотря на все факторы, подталкивающие их к обману. Для специалиста по теории игр вопрос заключается в том, почему так происходит. Вопрос этот становится особенно интересным, если учесть, что, согласно существующим исследованиям по играм с ненулевой суммой, наиболее соблазнительными для игроков свойствами обладает минимаксное решение (предполагающее обоюдный обман). В этой связи до недавнего времени оставалось неясным, каков, собственно, механизм сотрудничества (кооперации) в “дилемме заключенного”.

Ключ к решению этой проблемы лежит, по-видимому, в том, что игра носит итеративный характер – т.е. повторяется много раз, – что позволяет каждой из сторон многократно наказывать другую за обман. В серии весьма искусных опытов, проведенных в начале 80-х годов, Роберт Аксельрод показал, что простая стратегия игры “зуб за зуб” – т.е. причинение противнику всего того, что он причинил вам в предыдущем туре игры, – оказывается предпочтительной в ситуации, когда большое число игроков занято в играх типа “дилеммы заключенного”. В частности, если из двух игроков оба руководствуются стратегией “зуб за зуб”, то, начав игру с сотрудничества, они и далее [c.489] будут продолжать в том же духе. Если игрок, следующий стратегии “зуб за зуб”, встречается с игроком, склонным к обману, то это, скорее всего, приведет к их взаимному уничтожению. Следовательно, в реальной действительности, где распространены ситуации типа “дилемма заключенного”, наиболее удачливыми окажутся, скорее всего, те игроки, которые согласны сотрудничать по принципу “зуб за зуб”. В тех ситуациях, в которых не умеющие или не желающие сотрудничать игроки имеют мало шансов на выживание (как в описанной выше позиционной войне или в выполнении условий деловых контрактов), успех будет, в конечном счете, на стороне того игрока, действующего по принципу “зуб за зуб”, с которым сотрудничать вполне безопасно. Это во многом объясняет, почему сотрудничество реально существует в мире, где нет ни принуждения к выполнению контрактов, ни договоренностей между игроками и где противника, пытающегося сотрудничать, выгодно обмануть.

Приведенный пример всего лишь в общих чертах дает представление об исследованиях Аксельрода и др. и о той обширной литературе, которая посвящена игре “дилемма заключенного”. Небольшие видоизменения в этой игре позволяют, кроме всего прочего, исследовать такие проблемы, как вопрос об осмысленности применения угроз, о преимуществах, которые можно получить от прерывания сделки или переговоров (стратегия “сжигания мостов”), о важности блефования и отвлекающих маневров, о значимости случайного поведения, а также целый ряд других характерных особенностей ситуаций состязания.

Пример 3. Модель Даунса

В начале работы сессии конгресса 99-го созыва в январе 1985 г. к присяге при вступлении в должность были приведены только 434 члена палаты представителей вместо обычных 435. Одно место по 8-му избирательному округу штата Индиана оставалось незанятым ввиду того, что ситуация, сложившаяся в предвыборной борьбе между кандидатом от демократов преподобным Фрэнсисом Макклоски и его соперником-республиканцем Ричардом Ф. Макинтайром, была близка к патовой. Согласно первоначальному подсчету, Макклоски обошел соперника только на 72 голоса (из 233 тыс. поданных бюллетеней), т.е. на [c.490] 0,03%. Окончательный подсчет, предпринятый палатой и послуживший причиной демонстративного ухода с заседания одного из депутатов-республиканцев, показал отрыв в пользу Макклоски уже только в четыре голоса, т.е. 0,0017% всех поданных голосов.

Чтобы представить этот случай в истинном свете, зададимся вопросом, какова вероятность того, что 233 тыс. избирателей, каждый из которых должен опустить в избирательную урну зеленый или красный бюллетень, сделают свой выбор так, что окончательное соотношение бюллетеней разного цвета в урне лишь на 0,03% отклонится от идеального разбиения 50:50? Даже если допустить, что всем избирателям одинаково безразлично, какого цвета бюллетень опустить в урну, – эта вероятность не превышает 0,0005 (огрубленно 1 шанс из 2000). Поэтому выборы, приближающиеся по результатам к игре вничью, следовало бы расценивать как крайне маловероятное событие. И, однако, в американской избирательной системе они совсем не так уж редки. Например, из семи президентских выборов три закончились с перевесом одного претендента над другим менее чем в 2% общего числа поданных голосов.

1960 г.	Кеннеди Никсон разность	34 226 731 34 108 157 118 574	(0,17 %)
1968 г.	Никсон Хамфри разность	31 785 480 31 275 166 510 314	(0,81 %)
1976 г.	Картер Форд разность	40 380 763 39 147 973 1 232 790	(1,5 %)

К этому можно было бы добавить много других примеров, относящихся к выборам в конгресс, в органы власти штатов и округов.

С точки зрения разработчика математических моделей, это довольно загадочное явление: почему столько результатов выборов оказываются между собой намного ближе, чем ожидалось бы даже при случайном распределении? В одной из своих работ по формальному моделированию в политологии Энтони Даунс предложил простой механизм объяснения этого феномена. [c.491]

Даунс использовал модель, впервые предложенную Хэролдом Хотеллингом в 1929 г. для объяснения того, почему бакалейные лавки в провинциальных городках, как правило, располагаются вблизи друг от друга. В качестве примера в рамках базовой модели Хотеллинга возьмем следующий. Допустим, что городок представляет собой шахтерский поселок в глубокой провинции, а ближайший магазин расположен от него в 50 милях. В поселок приезжают, чтобы открыть в нем магазины, два торговца-конкурента. Из опыта торговли в шахтерских поселках оба они одинаково хорошо знают, какие товары будут здесь пользоваться спросом, поэтому единственное, чем их магазины могут различаться, – это месторасположение, потому что клиенты-шахтеры, очевидно, предпочтут посещать тот магазин, который находится ближе. В подобном случае существует только одно место, идеально подходящее для расположения магазина, – это точка, в которой среднее расстояние от дома каждого шахтера до магазина является минимальным. Если оба владельца магазинов это осознают, то они расположат свои лавки в одном и том же месте, несмотря на то, что они окажутся впритык друг к другу, и, добавим мы, несмотря на то, что расположение лавок вдали друг от друга сократило бы время, необходимое части клиентов, чтобы дойти от дома до лавки, и притом сохранило бы возможность для владельцев лавок поровну поделить между собой объем коммерции (кстати сказать, это последнее соображение являет собой еще один пример “дилеммы заключенного”).

Логику модели Хотеллинга Даунс применил к ситуации выборов. В простейшей модели Даунса предполагается, что избиратели упорядочены соответственно своим политическим мнениям – от либералов до консерваторов (как показано на рис. 17.3). Предполагается также, что каждый избиратель будет голосовать за того кандидата, который идеологически ему ближе. В подобной ситуации кандидаты будут стремиться быть идеологически как можно ближе к “золотой середине” (точка, помеченная на рисунке буквой С). Если один кандидат займет центристскую позицию (точка С), а другой кандидат займет позицию, отличную от центристской (скажем, соответствующую точке О), то последний проиграет на выборах: ведь за кандидата, занимающего точку С, проголосует более 50% [c.492] избирателей, расположенных вправо от С, затем голоса распределятся в промежутке от С до О и, таким образом, это будет означать победу данного кандидата на выборах. Это саморегулирующийся процесс: кандидат может его проигнорировать, но только ценой своего провала на выборах. Поэтому следует думать, что опытные политики – те, которые уже неоднократно одерживали победу на выборах, – обладают способностью вычислять или угадывать, где расположена политическая “золотая середина”.

Эта модель объясняет то важное наблюдение, что на многих выборах голоса разбиваются почти пополам: ведь опытные кандидаты будут стараться быть как можно ближе к центру голосования. Однако модель Даунса предсказывает, что у кандидатов при этом будут почти одинаковые позиции, а это вовсе не обязательно так. Кандидаты на выборах в США по большей части очень близки идеологически, но все же редко настолько близки, насколько это предполагается данной моделью. Поэтому надо посмотреть, не нуждается ли модель в каких-то дополнительных допущениях.

К этой проблеме можно подходить с разных сторон, но простое наблюдение свидетельствует о том, что в большинстве округов каждый кандидат должен пройти два тура выборов – первичный и всеобщий. На первичных выборах распределение идеологических акцентов отклоняется от точки центра. Пунктирные линии на рис. 17.3 показывают гипотетическое распределение голосов в первичных турах отдельно республиканской и отдельно демократической партии: голоса на республиканских первичных выборах обычно сдвинуты сильно вправо, а на демократических – сильно влево, притом, что многие центристски настроенные избиратели в первичных турах вообще не участвуют. Применяя к первичному туру модель [c.493] Даунса – Хотеллинга, мы видим, что для того, чтобы победить, каждый кандидат будет стремиться занять позицию в центре голосов, отданных его партии (на рисунке – точки Д и Р), и тем самым удалится от точки С.

Если бы избиратели не придавали значения постоянству позиции кандидата, то самым логичным для каждого кандидата было бы во время первичных выборов занимать позицию партийного центра, а затем немедленно переориентироваться, заняв точку общеэлекторатного центра С. Однако избиратели не столь забывчивы, поэтому кандидатам приходится, двигаясь в сторону центра, не отрываться и от своей первоначальной позиции, чтобы их не обвинили в неустойчивости взглядов. Более того, в том случае, если позиция партийного центра и позиция общеэлекторатного центра разделены значительным расстоянием, кандидат, избранный на первичных выборах, может оказаться просто не в состоянии занять выигрышную позицию на всеобщих выборах и проиграет с большим отрывом от соперника (как это случилось, например, с Барри Голдуотером в 1964 г. и с Джорджем Макговерном в 1972 г.). Но в ситуации, когда оба кандидата изначально сильно удалены от центра, они вполне могут расщепить итоги голосования почти точно надвое, выбрав соответствующие симметрично расположенные относительно точки С, но при этом несовпадающие позиции. Как на то указывает частота выборов с исходом голосования 50:50, американские политики, по-видимому, очень хорошо умеют выбирать именно такие позиции.

Представленная здесь модель являет собой всего лишь простейший вариант модели Даунса; и сам Даунс, и другие исследователи занимались разработкой более сложных вариантов, чем этот. В реальной жизни мнения избирателей не поддаются строгому упорядочению в виде колоколообразной кривой, проходящей вдоль единой фиксированной идеологической оси; вместо этого они занимают меняющиеся позиции на целом ряде осей, а по некоторым вопросам занимают сильно отличные друг от друга позиции. Однако даже столь простая модель позволяет объяснить, почему некоторые, но не все выборы кончаются с исходом голосования почти 50:50, почему кандидаты не занимают на всеобщих выборах совпадающих позиций и почему кандидаты часто меняют свои [c.494] идеологические позиции в промежутке между первичными и всеобщими выборами. [c.495]

ДРУГИЕ ТИПЫ МОДЕЛЕЙ

Приведенные в этой главе примеры могут дать лишь очень поверхностное представление о математических моделях политического поведения. Необходимо также упомянуть, по крайней мере, некоторые другие типы моделей.

Существует обширная литература по принятию решений относительно ожидаемой полезности той или иной меры; такое принятие решений является способом моделирования соответствующих ситуаций, сопряженных с риском или неопределенностью. Эти модели очень широко используются в анализе, проводимом в целях выбора той или иной государственной политики. Типичные проблемы, связанные с определением ожидаемой полезности, – это, например, такие: “следует ли строить атомную электростанцию в районе с повышенной сейсмической активностью?”; “сколько песка и соли должно запасти на зиму управление строительства и эксплуатации дорог?”; “следует ли расходовать 1 млн. долларов на спрямление потенциально опасного участка автострады?”. Такие модели часто применяются в политической практике в качестве прескриптивных моделей (помогающих решить, какие меры следует предпринять), но в дескриптивном моделировании (предсказывающем, что люди будут делать на самом деле), они оказываются фактически бесполезными, поскольку большинство индивидов, принимая свои решения, этим моделям не следуют.

К моделям ожидаемой полезности близки модели оптимизации, которые по большей части были заимствованы политологией из экономической науки и инженерного дела. Почти всякое рациональное поведение включает в себя процессы своего рода минимизации и максимизации. Для определения оптимального поведения существует целый набор сложных математических приемов, которые показали свою полезность как в случаях “борьбы с природой”, когда в качестве “соперника” выступает непредсказуемое будущее, так и в ситуациях конкуренции с малым числом участников, а кроме того, в условиях рынка, когда обстановка определяется очень большим [c.495] числом участников. Ввиду того, что эти модели детально разработаны и носят весьма общий характер, они представляют собой потенциально мощные средства изучения проблем, связанных с политическим поведением.

Совсем новая область математического моделирования имеет дело с компьютерными моделями, связанными с более широкой областью компьютерного моделирования искусственного интеллекта. В то время как большая часть существующих моделей базируется на классических разделах математики – логике, геометрии, алгебре и дифференциальном исчислении, – компьютерные модели основываются на программировании с использованием не уравнений, а алгоритмов (строго сформулированных последовательностей инструкций). Компьютерные модели бывают особенно эффективны при изучении ситуаций, сопряженных с обработкой большого количества информации, например процессов поиска в памяти, обучения, нечисловых процессов.

Наиболее употребительной формой компьютерной модели является экспертная система, в которой используется большое количество установок типа “если ... то”. Экспертные системы проявили свои возможности в точном воспроизведении поступков людей в самых разнообразных областях и особенно привлекательны тем, что позволяют моделировать политическое поведение. Компьютерное моделирование является также основным моментом в изучении особо сложных систем, являющихся относительно новой областью. В этих моделях не только уровни переменных изменяются во времени, но также меняются и лежащие в основе математические процессы. [c.496]

СЛОЖНОСТИ, СВЯЗАННЫЕ С МОДЕЛИРОВАНИЕМ

Памятуя афоризм Найвена; “Нет такого благородного дела, к которому не пристали бы дураки”, – к использованию математических моделей следует подходить с определенной осторожностью.

Первая и самая общая предосторожность вытекает из поговорки “Что посеешь – то и пожнешь”: модель не может быть лучше заложенных в нее исходных допущений. В частности, и рассуждение, которое, будучи выражено на [c.496] естественном языке, не имеет смысла, не станет более осмысленным, если его перевести в математическую форму. Всегда важно помнить, что математика эффективна только как средство получения логических выводов из исходных допущений, а отсюда и валидность модели зависит не от математического аппарата, а от этих самых допущений.

Бывают случаи, когда для успешного применения той или иной мощной методики необходимо упростить исходные допущения, но даже подобное упрощение должно проходить проверку практикой и здравым смыслом. Если модель основана на ложных исходных допущениях, то это не значит, что и выводы ее будут ложными, но значит, что валидность этих выводов никоим образом не может быть отнесена на счет исходных допущений⁶.

Самый частый недостаток, с которым приходится сталкиваться в моделях, – это сверхупрощенные исходные допущения. Эйнштейну приписывается утверждение: “Модели должны быть простыми, насколько это возможно... но не более того”. Конечно, упрощение является целью любой математической модели, но только до тех пор, покуда модель как целое продолжает отражать основные процессы, составляющие ее объект. Почти во всех случаях бывают такие ситуации, когда модель в силу своей упрощенности дает сбой. К примеру, модель Ричардсона гонки вооружений не работает в ситуациях, связанных с ядерным оружием, поскольку ядерное оружие, представляя собой весьма действенную и к тому же неограниченную угрозу для противника, не предполагает крупных экономических расходов. В таких случаях важно, чтобы разработчик модели указал, каковы ожидаемые пределы применения модели. Эти ограничения, следует отметить, носят тот же характер, что и в естественных науках: различные химические реакции происходят, согласно предписанию, только при соблюдении немалого числа условий – при определенной температуре, давлении, влажности и т.п.

Модель обязательно должна проходить экспериментальную проверку, если только она не задана исчерпывающим образом с помощью своих исходных допущений. В большинстве случаев в модель входят параметры, подлежащие внешней оценке, или исходные допущения о действительности, подлежащие верификации. Здесь мы видим еще один способ проверки исходных допущений на [c.497] валидность: если модель, будучи корректной, с логической точки зрения, дает ложные результаты, то из этого следует, что ложны, должно быть, ее исходные допущения.

Наконец, выданные моделью результаты должны быть правильно переведены на естественный язык. Обычная ошибка при моделировании состоит в том, что исследователь начинает “в лоб” трактовать результаты, полученные от достаточно узкой модели, тем самым переоценивая общность ее выводов. Это распространеннейшая людская слабость – чрезмерное увлечение своим творением и приписывание ему большего, нежели то, на что оно реально способно; среди математиков это явление известно как “синдром Пигмалиона”. Средства массовой информации также склонны время от времени выказывать интерес к методам моделирования, приписывая им всевозможные чудодейственные свойства. Такой обработке лет десять назад подверглась второстепенная топологическая методика, носящая название теории катастроф и претендовавшая на умение предсказывать резкие изменения в социальных и биологических системах. То же самое имело место и с узким разделом теории вероятностей, известным под названием теории размытых множеств, в рамках которого допускается описание свойств объекта в терминах “очень большой” и “маловатый”, наряду с более простыми “большой” и “маленький”. Предусмотрительному исследователю, вознамерившемуся использовать математическую модель, можно посоветовать предварительно убедиться в том, что результаты, на которые претендует данная теория, действительно выводятся из ее исходных предположений (если принять их на веру) без апелляции к каким-либо дополнительным допущениям и бездоказательным скачкам в рассуждениях. [c.498]

ВЫВОДЫ

Суммируя сказанное, констатируем, что математические модели в гораздо большей степени, чем естественный язык, помогают продвинуться в получении сложных выводов из некоторого множества исходных допущений. Кроме того, мир политики, по-видимому, достаточно регулярен, чтобы выводы, полученные от математических моделей, выдерживали эмпирическую проверку на валидность. Эта область знаний насчитывает всего несколько [c.498] десятков лет, но уже сделала за это время огромные шаги вперед, и при этом ограничения ее видятся весьма немногочисленными.

Моделировать политические и социальные явления сложно – обычно намного сложнее, чем моделировать природные процессы; это обусловлено тем, что люди сложнее и непредсказуемее простых атомов. Эта сложность выливается в следующие две импликации, связанные с моделированием политического поведения.

Во-первых, моделирование начинается с более простых и регулярно наблюдаемых типов поведения и лишь затем переходит к более сложным типам. Как следствие, некоторые из моделируемых явлений могут показаться тривиальными, в то время как к “крупным вопросам” сразу подступиться бывает трудно или невозможно. В противоположность этому при интуитивном, неформальном подходе к политическому анализу мы можем в любое время обратиться к любому сколь угодно крупному вопросу. Получаемые при этом ответы, однако, оказываются часто неверными – достаточно бегло припомнить, сколько в истории человечества было войн, кровопролитий, нищеты и нелепых ошибок, чтобы понять, что интуитивные модели редко бывают безупречными. Поскольку мы всегда можем, в конечном счете, прибегнуть к неформальной модели, использование формальных моделей в состоянии лишь улучшить наш политологический анализ.

Во-вторых, математические средства, необходимые для анализа политических проблем, по всей вероятности, должны быть более разнообразными и сложными, нежели те, которые применяются для решения классических естественнонаучных проблем. В частности, модели социальных процессов по сравнению с моделями природных систем, вероятно, будут связаны с большей степенью случайности, а также с обработкой большего количества информации и большего числа переменных. В то же время появление электронных вычислительных устройств позволило иметь дело с формальными системами, куда более сложными, чем те, которые поддаются “ручной” обработке, а в будущем использование компьютеров обещает политологии еще более значительный прогресс. [c.499]