Руководства, Инструкции, Бланки

факторный анализ в Spss пошаговая инструкция img-1

факторный анализ в Spss пошаговая инструкция

Категория: Инструкции

Описание

Как делать факторный анализ

Как делать факторный анализ

Для проведения факторного анализа используйте компьютерную программу SPSS (Statistical Package for the Social Sciences). Кроме обработки данных в рамках факторного анализа эта программа позволяет проводить дисперсионный анализ, применять непараметрические методы и графически представлять результаты данных, полученных в исследованиях. Установите указанную программу на компьютер и запустите.

Подготовьте данные для проведения факторного анализа. Например, это могут быть статистические данные по результатам социологического опроса, касающегося одной из социальных проблем. Результаты социологического опроса, оцененные по той или иной шкале, сохраните в отдельный файл с расширением .sav.

Откройте указанный файл в программе. Выберите в меню «Анализ» вкладку «Факторный анализ». Вы увидите открывшееся диалоговое окно. Поместите в поле тестируемых переменных имеющиеся у вас переменные (результаты опроса в численном выражении).

Щелкните по кнопке «Дескриптивные статистики», оставив вывод первичных результатов анализа, включающих в себя первичные статистики и дисперсии простых факторов. При необходимости оставьте также корреляционные коэффициенты и одномерные статистики.

При помощи кнопки «Отбор» выберите метод отбора. При затруднениях в выборе оставьте значения по умолчанию; при этом число отобранных факторов будет приравнено к числу собственных значений.

Выключателем «Вращение» выберите метод вращения. В самом простом случае остановите выбор на методе варимакса, оставив активным вывод матрицы факторов. Теперь вы можете организовать вывод факторных нагрузок в трехмерном графическом виде.

Чтобы отыскать значения факторов, используйте выключатель «Значения» и отметьте факторы, выбрав «Сохранить как переменные». Для проведения подсчетов щелкните на кнопке OK. В окне обзора вы увидите результаты, в том числе и первичные статистики и сами факторы.

Теперь попытайтесь объяснить отобранные факторы. Для этого распечатайте выведенную на экран таблицу, а затем в каждой строке факторной матрицы отметьте факторную нагрузку с наибольшим абсолютным значением. В результате вы должны получить не менее трех факторов, которые вам предстоит проанализировать уже с качественной точки зрения, без применения программных методов. В самом идеальном варианте вы должны провести словесное объяснение факторов, дав им осмысленные названия.

Другие статьи

В SPSS: Порядок выполнения факторного анализа - Студопедия

В SPSS: Порядок выполнения факторного анализа

На первом шаге процедуры факторного анализа происходит стандартизация заданных значений переменных (z-преобразование); затем при помощи стандартизированных значений рассчитывают корреляционные коэффициенты Пирсона между рассматриваемыми переменными.

Исходным элементом для дальнейших расчётов является корреляционная матрица. Для понимания отдельных шагов этих расчётов потребуются хорошие знания, прежде всего, в области операций над матрицами; интересующимся подробностями советуем обратиться к специальной литературе. Для построенной корреляционной матрицы определяются, так называемые, собственные значения и соответствующие им собственные векторы, для определения которых используются оценочные значения диагональных элементов матрицы (так называемые относительные дисперсии простых факторов).

Собственные значения сортируются в порядке убывания, для чего обычно отбирается столько факторов, сколько имеется собственных значений, превосходящих по величине единицу. Собственные векторы, соответствующие этим собственным значениям, образуют факторы; элементы собственных векторов получили название факторной нагрузки. Их можно понимать как коэффициенты корреляции между соответствующими переменными и факторами. Для решения такой задачи определения факторов были разработаны многочисленные методы, наиболее часто употребляемым из которых является метод определения главных факторов (компонентов).

Описанные выше шаги расчёта ещё не дают однозначного решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. И здесь имеется большое количество методов, наиболее часто употребляемым из которых является ортогональное вращение по так называемому методу варимакса. Факторные нагрузки повёрнутой матрицы могут рассматриваться как результат выполнения процедуры факторного анализа. Кроме того на основании значений этих нагрузок необходимо попытаться дать толкование отдельным факторам.

Если факторы найдены и истолкованы, то на последнем шаге факторного анализа, отдельным наблюдениям можно присвоить значения этих факторов, так называемые факторные значения. Таким образом для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов.

Иногда один объект может хар-ся множеством признаков (многомерные объекты), тогда возникает необходимость сокращения числа наблюдений, но при условии, что новые переменные так же хорошо характеризуют явления.

Причины снижения числа наблюдений:

4. Необходимость наглядного представления исходных данных;

5. Стремление к локанизму исследуемых моделей.

6. Необходимость существенного сжатия объемов хранимой информации.

Предпосылки перехода от бОльшего числа признаков р к меньшему р’:

1. Дублирование информаии, описываемой сильно взаимодействующими признаками,

2. Не информативность признаков, маломеняющихся при переходе от 1го объекта к др.

3. Возможность агрегирования (простого суммирования по некоторым признакам).

Для этой цели используется анализ методом главных компонентов – статистический метод сокращения числа наблюдений, необходимый для описания того или иного явления. Суть метода — сократить число объясняющих пе­ременных до наиболее существенно влияющих факторов. Метод главных компонент применяется для исключе­ния или уменьшения мультиколлинеарности объясняющих пере­менных регрессии. Основная идея заключается в сокращении числа объясняющих переменных до наиболее существенно влия­ющих факторов. Это достигается путем линейного преобразова­ния всех объясняющих переменных x i (i=0. n) в новые пере­менные, так называемые главные компоненты. При этом требу­ется, чтобы выделению первой главной компоненты соответство­вал максимум общей дисперсии всех объясняющих переменных x i (i=0. n). Второй компоненте — максимум оставшейся дис­персии, после того как влияние первой главной компоненты ис­ключается и т. д. (гл компонента представляет собой линейную комбинацию р-переменных).

*Коэффициенты гл компонент оцениваются таким образом, чтобы дисперсия гл компоненты была максимальной.

*Если переменые Х представлены в одних и тех же единицах измерения, то необходимо использовать ковариационную матрицу, если нет –то корр.

*сумма квадратов всех компонент д.б.=1

*первая гл компонента характеризуется максимальной дисперсией, чем больше значение дисперсии, тем важнее компонента.

37. Интерпритация факторов: На данном этапе исследователь должен превратиться из статистика, заботящегося в первую очередь о правильности и точности вычислений, в эксперта по проблеме, закономерности которой исследовались с помощью факторного анализа. Теперь необходимо взять на вооружение все наши знания о переменных, подвергшихся фа, и начать с тщательного анализа последней факторной матрицы для определения того, какие переменные существенно нагружены данным фактором, а какие вообще с ними не связаны. Первые гипотезы о природе выявленных факторов могут основываться на наблюдениях и наших знаниях о самих переменных.

Пр.. от Кеттела: выобрака из 2х пьяных и 2х трезвых людей. 1 пил виски с содовой, 2- вино с содовой, трезвые – ничего не пили. То получим корреляции, которые укажут на какой-то общий фактор. Этим фактором больше всех будут загружены переменные «состояние опьянения» и «содовая вода». В этом случае только тот, кто знает, что переменные «виски « и «вино» включает общий фактор – алкоголь, распознает его роль при переменной «состояние опьянения». Только использование достаточно обширной выборки, включающей также людей, которые пили только содовую веду без алкоголя, уменьшит у переменной «содовая вода» нагрузку факторов «опьянения» и особенно «алкоголь» до минимальных размеров.

Сущностью факторного анализа является процедура вращения факторов, то есть перераспределения дисперсии по определённому методу. Цель ортогональных вращений — определение простой структуры факторных нагрузок, целью большинства косоугольных вращений является определение простой структуры вторичных факторов, то есть косоугольное вращение следует использовать в частных случаях.

Необходимость вращения факторов возникает чаще всего, когда выявленным факторам не удается дать достаточно четкую содержательную интерпретацию. Например, факторные нагрузки для рассматриваемого фактора могут быть близкими по величине и одинаковыми по знаку у многих признаков, так что трудно однозначно определить, какой фактор 'стоит' за выделенной комбинацией признаков. Вращение позволяет сделать матрицу факторных нагрузок более 'контрастной' за счет увеличения нагрузок по одним признакам и уменьшения по другим, что способствует более отчетливому выявлению групп признаков, определяющих тот или иной фактор.

При первом виде вращения каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, поэтому факторы оказываются независимыми, некоррелированными друг от друга (к этому типу относится МГК). Второй вид — это преобразование, при котором факторы коррелируют друг с другом. Преимущество косоугольного вращения состоит в следующем: когда в результате его выполнения получаются ортогональные факторы, можно быть уверенным, что эта ортогональность действительно им свойственна, а не привнесена искусственно.

Аналитические и геометрические методы – может быть это расчитанные вручную и нарисованные (графическое изображение)-не уверена.

Решение задач можно осуществлять 2 методами:

1. используя геометрическую интерпретацию проблемы (рисунки, графики, модели);

2. выполняя соответствующие вычисления, приводящие к определению нового положения системы новых проекций.

Используя лишь графики, нельзя достич высокой точности результатов, не говоря уже о том, что в многмерных случаях их применение требует кропотливой работы. Однако, применительно к задаче определения наилучшего положения осей графическая интерпритация играет главную роль. Только с ее помощью можно представить наглядно, как перемещаются отдельные группы точек относительно вращаемых осей, что облегчает поиск простой структуры.

Точное определение можно получить с помощью алгебраических и тригоноометрических вычислений, которое осуществляется в факторном анализе посредством вычисления формул.

Порядок выполнения факторного анализа

Порядок выполнения факторного анализа

19.1. Порядок выполнения факторного анализа

На первом шаге процедуры факторного анализа происходит стандартизация заданных значений переменных (z-преобразование); затем при помощи стандартизированных значений рассчитывают корреляционные коэффициенты Пирсона между рассматриваемыми переменными.

Исходным элементом для дальнейших расчётов является корреляционная матрица. Для понимания отдельных шагов этих расчётов потребуются хорошие знания, прежде всего, в области операций над матрицами. Для построенной корреляционной матрицы определяются, так называемые, собственные значения и соответствующие им собственные векторы, для определения которых используются оценочные значения диагональных элементов матрицы (так называемые относительные дисперсии простых факторов).

Собственные значения сортируются в порядке убывания, для чего обычно отбирается столько факторов, сколько имеется собственных значений, превосходящих по величине единицу. Собственные векторы, соответствующие этим собственным значениям, образуют факторы; элементы собственных векторов получили название факторной нагрузки. Их можно понимать как коэффициенты корреляции между соответствующими переменными и факторами. Для решения такой задачи определения факторов были разработаны многочисленные методы, наиболее часто употребляемым из которых является метод определения главных факторов (компонентов).

Описанные выше шаги расчёта ещё не дают однозначного решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. И здесь имеется большое количество методов, наиболее часто употребляемым из которых является ортогональное вращение по так называемому методу варимакса. Факторные нагрузки повёрнутой матрицы могут рассматриваться как результат выполнения процедуры факторного анализа. Кроме того на основании значений этих нагрузок необходимо попытаться дать толкование отдельным факторам.

Если факторы найдены и истолкованы, то на последнем шаге факторного анализа, отдельным наблюдениям можно присвоить значения этих факторов, так называемые факторные значения. Таким образом для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов.

Факторный анализ — это статистический инструмент, довольно часто используемый в психологии при создании многофакторных тестов, а также при систематизации и обобщении комплексных наблюдений. Многочисленные варианты его использования включают конструирование тестов, выявление основных параметров личности и способностей, установление того, сколько отдельных психологических характеристик (т.е. черт) измеряется набором тестов или заданиями теста.

Термин «факторный анализ» может относиться к двум довольно разным статистическим методикам:

Исследовательский факторный анализ (эксплораторный факторный анализ) — более старая и более простая методика.
  • Конфирматорный факторный анализ и его разновидности (известные как «анализ путей», «анализ латентных переменных» или «модели LJSREL») полезны во многих областях за пределами изучения индивидуальных различий и особенно популярны в социальной психологии. Авторы не всегда четко указывают, какой из видов факторного анализа использовался — исследовательский или конфирматорный. Если вы увидите термин «факторный анализ» в журнале, следует допустить, что имеется и виду исследовательский факторный анализ.

  • Часто при создании психологического теста важно, чтобы все задания шкалы измеряли одну (и только одну) психологическую переменную. Коэффициент альфа Кронбаха может служить показателем надежности шкалы. Эта техника исходит из того, что все задания в тесте формируют одну шкалу и коэффициент надежности, в сущности, проверяет, насколько это допущение обоснованно.

    Однако рассмотрим более простой пример. В интересах науки планируете собрать следующие данные у случайно сформированной выборки, например, у 200 студентов:

    • V 1 — вес тела (в кг);
    • V 2 — степень невнятности речи (ранжируется по шкале от 1 до 5);
    • V 3 — длина ноги (в см);
    • V 4 — разговорчивость (ранжируется по шкале от 1 до 5);
    • V 5 — длина руки (в см);
    • V 6 — степень шатания при попытках пройти по прямой линии (ранжируется по шкале от 1 до 5).

    Кажется вероятным, что V1 ,V3 и V5 будут варьировать совместно, поскольку крупные люди будут склонны иметь длинные руки и ноги и больше весить. Все эти три пункта измеряют некоторое фундаментальное свойство индивидуумов вашей выборки: их размеры. Точно так же вероятно, что V2, V4 и V6 будут варьировать совместно, так как количество употребленного алкоголя, вероятно, будет связано с четкостью речи, разговорчивостью и с осложнениями при попытках пройти по прямой линии. Таким образом, хотя мы собрали шесть фрагментарных данных, эти переменные измеряют только 2 конструкта: размеры тела и степень опьянения. В факторном анализе вместо слова «конструкт» обычно используется слово «фактор», и далее мы будем следовать этой традиции.

    Исследовательский факторный анализ, по существу, выполняет две функции:

    Он показывает, сколько отдельных психологических конструктов (факторов) измеряется данным набором переменных. В приведенном выше примере такими двумя факторами являются размеры тела и степень опьянения.

    Он показывает, какие именно конструкты измеряют использованные переменные. В приведенном выше примере было показано, что VI. V 3 и V 5 измеряют один фактор и V2, V4 и V6 измеряют другой, совершенно отличный фактор.

    В некоторых формах факторного анализа дополнительно можно прокоррелировать факторы между собой, и затем вычислить для каждого испытуемого индивидуальную оценку по каждому фактору в целом («факторные оценки»).

    Оценки по полным тестам (а не по его отдельным заданиям) также могут подвергаться факторному анализу — на самом деле именно так эта методика и используется. Факторный анализ в этом случае может показать, действительно ли тесты, которые, предположительно, измеряют один и тот же конструкт (например, шесть тестов, которые претендуют на измерение тревожности), продуцируют один фактор, или же в этом случае будут выделены несколько факторов (указывая на то, что тесты на самом деле измеряют несколько разных характеристик). Факторный анализ оценок, полученных на основе полных тестов, может быть чрезвычайно полезен для установления того, что именно измеряется группой тестов, поскольку многозначность языка допускает, что одному и тому же конструкту разными исследователями могут быть даны различные наименования. «Тревога» у одного автора может обозначать то же самое, что «нейротизм» — у другого или «негативный аффект» — у третьего. Число терминов, используемых в психологии индивидуальных различий, потенциально безгранично, и без факторного анализа нет надежного способа установить, действительно ли несколько шкал измеряют один и тот же базисный психологический феномен. Например, если в издательском каталоге указано, что имеются психологические средства измерения «нейротизма», «тревоги», «истерии», «силы Эго», «нервозности», «низкой самоактуализации» и «боязливости», кажется разумным задать вопрос: действительно ли это шесть отдельных понятий или это одна и та же характеристика, которой исследователи, имеющие разные теоретические воззрения, дали различные названия? Факторный анализ может точно ответить на этот вопрос, и поэтому он чрезвычайно полезен для упрощения структуры личности и способностей.

    Возможности факторного анализа не ограничиваются анализом заданий или оценок теста. Можно факторизовать, например, показатели времени реакции, взятые из когнитивных тестов различного типа, чтобы определить, какие из них (если такие есть) связаны между собой. Возможен и иной подход. Предположим, что группу школьников, которые не имели специальной спортивной подготовки или спортивной практики, оценивали с точки зрения их успешности в соревнованиях по 30 видам спорта с помощью комплекса оценок, включавшего рейтинги тренеров, регистрацию времени, среднюю длину броска, процент отсутствия очков при игре в крикет, забитые голы и любые другие измерения показателей успешности, наиболее подходящие для каждого вида спорта. Единственное условие состоит в том, что каждый ребенок должен участвовать в каждом виде соревнования. Факторный анализ обнаружит много интересных фактов; например, он покажет, будут ли индивидуумы, успешные в одной игре с мячом, демонстрировать тенденцию к успешности во всех остальных играх, будут ли соревнования по бегу на длинные и короткие дистанции образовывать две различные группы (и какой вид соревнования будет входить в какую группу) и т.д. Таким образом, вместо того чтобы обсуждать происходящее в терминах успешности в 30 различных областях, будет возможно суммировать эту информацию, обсуждая ее в категориях шести основных спортивных способностей (или стольких способностей, сколько выявит факторный анализ).

    Лекции - Статистический анализ в SPSS

    / Лекции - Статистический анализ в SPSS

    5.2.1. Факторный анализ

    Итак, из условия представленной выше задачи следует, что у нас есть массив дан­ных, состоящий из 24 независимых переменных (утверждений), в различных ас­пектах описывающих текущее состояние авиакомпании Xна международном рынке авиаперевозок. Основной задачей проводимого факторного анализа является груп­пировка схожих по смыслу утверждений в макрокатегории с целью сократить чис­ло переменных и оптимизировать структуру данных.

    При помощи меню Analyze >Data Reduction > Factor вызовите окно Factor Analysis. Пе­ренесите из левого списка в правый переменные для анализа (ql-q24), как показа­но на рис. 5.32. ПолеSelectionVariableпозволяет выбрать переменную, в разрезе которой будет проводиться анализ (например, класс полета). В нашем случае ос­тавьте это поле Пустым.

    Щелкните на кнопке Descriptivesи в открывшемся диалоговом окне (рис. 5.33) вы­берите пункт КМОandBarlett'stestofsphericity. Это позволит определить, насколько имеющиеся данные пригодны для факторного анализа. ОкноDescriptivesпозволя­ет вывести и другие необходимые описательные статистики. Однако в большин­стве примеров из маркетинговых исследований эти возможности, как правило, не используются.

    Рис. 5.32. Диалоговое окно Factor Analysis

    Рис. 5.33. Диалоговое окно Descriptives

    Закройте окно Descriptives, щелкнув на кнопкеContinue. Далее откройте окноExtraction(рис. 5.34), щелкнув на соответствующей кнопке в главном диалоговом окнеFactorAnalysis. Это окно предназначено для выбора метода формирования факторной модели; выполните в нем следующие действия.

    Рис. 5.34. Диалоговое окно Extraction

    Во-первых, в поле Methodвыберите метод извлечения (формирования) факторов. Общая рекомендация по выбору метода состоит в следующем. Необходимо выби­рать тот метод извлечения факторов, который позволяет однозначно классифицировать как можно больше переменных. Таким образом, основные соображения здесь — число классифицированных факторов и однозначность классификации (то есть каждая переменная должна принадлежать только одному фактору). Как вы увидите ниже, установленный по умолчанию вSPSSметодPrincipalcomponentsв нашем случае позволяет однозначно классифицировать 22 переменные из 24 име­ющихся (92 %), что является весьма хорошим показателем. На основании имею­щегося опыта автор может утверждать, что хорошим результатом факторного ана­лиза является доля однозначно классифицированных переменных не менее 90 %. Выберите методPrincipalcomponents. Данный метод является наиболее подходя­щим для решения большинства задач маркетинговых исследований при помощи факторного анализа.

    Во-вторых, укажите количество образуемых факторов (группа Extract). По умол­чанию установлен метод определения количества извлекаемых факторов на осно­вании значений характеристических чисел (Eigenvaluesover).Heвдаваясь в стати­стические тонкости, отметим, что характеристические числа используютсяSPSSдля определения количественного и качественного состава извлекаемых факто­ров. При предустановленном значении данного показателя. равном 1, количество образуемых факторов будет равно количеству переменных, значение характерис­тических чисел для которых больше или равно 1.

    Также существует возможность вручную указать программе, сколько факторов необходимо извлекать (Numberoffactors). Эта возможность предусмотрена вSPSSдля того, чтобы при слишком большом количестве переменных с характеристи­ческим числом больше 1 вручную сократить число факторов. Большое число фак­торов трудно интерпретировать, поэтому если методом характеристических чисел не удается извлечь приемлемое для интерпретации число факторов (чем меньше, тем лучше), следует самостоятельно указать программе число факторов. Эта зада­ча решается аналитиком в каждом конкретном случае индивидуально. В качестве одного из вариантов решения можно рекомендовать увеличить числоeigenvalueс предустановленного значения 1, скажем, до 1,5 или более. Это поможет, если по­лучено большое число факторов с характеристическим числом, приблизительно равным 1, и несколько (2-3 и более) факторов — с характеристическим числом более 1,5 или другого значения. Также при ручном определении количества фак­торов аналитик может принять релевантное решение, основываясь на своем опыте или на каких-либо иных предположениях. И наконец, необходимо отметить, что при ручном указании числа извлекаемых факторов иногда количество однознач­но классифицированных переменных оказывается меньше, чем при методе экст­ракции по величине характеристических чисел. Однако данный негативный мо­мент нивелируется возросшей наглядностью результатов факторного анализа — ведь это позволяет освободиться от факторов, в которых нет переменных со значи­мым коэффициентом корреляции (в нашем случае 0,5).

    Закройте диалоговое окно Extraction, щелкнув на кнопкеContinue. Выберите тип ротации матрицы коэффициентов (кнопкаRotationв главном диалоговом окнеFactorAnalysis). Ротация коэффициентной матрицы производится для того, чтобы мак­симально приблизить факторную модель к идеалу: возможности однозначно клас­сифицировать все переменные. В диалоговом окнеRotation(рис. 5.35) выберите конкретный метод ротации. В большинстве случаев наиболее приемлемым вари­антом является методVarimax. Он облегчает интерпретацию факторов, минимизируя количество переменных с высокими факторными нагрузками. Выберите этот тип ротации и закройте диалоговое окно, щелкнув на кнопкеContinue.

    Рис. 5.35. Диалоговое окно Rotation

    Далее откройте диалоговое окно FactorScores(рис. 5.36), щелкнув на кнопкеScores. Это окно служит для создания в исходном файле данных новых переменных, ко­торые в дальнейшем позволят отнести каждого респондента к определенной груп­пе (фактору). Число вновь создаваемых переменных равно числу извлеченных факторов. Ниже мы покажем, каким образом использовать данные переменные. Выберите в диалоговом окнеFactorScoresпараметрSaveasvariables, а в качестве метода определения значений для этих новых переменных — регрессионную мо­дельRegression. После этого закройте диалоговое окно, щелкнув на кнопкеContinue.

    Рис. 5.36. Диалоговое окно FactorScores

    Последним этапом перед запуском процедуры факторного анализа является вы­бор некоторых дополнительных параметров (кнопка Options). В открывшемся ди­алоговом окне (рис. 5.37) выберите два пункта:SortedbysizeиSuppressabsolutevalueslessthan. Первая опция позволяет вывести переменные, входящие в каждый фак­тор, в порядке убывания их факторных коэффициентов (величины вклада пере­менной в формирование фактора). Вторая оказывается весьма полезна, так как облегчает задачу однозначной интерпретации полученных факторов. Указанное в соответствующем поле значение данного параметра (в нашем случае 0,5) отсекает переменные с факторными коэффициентами менее данного значения. Это позво­ляет упростить ротированную матрицу факторов, поскольку из нее исчезают не­значимые переменные, входящие в каждый извлеченный фактор. Если вы не за­действуете данный параметр, для каждой переменной будет отображен факторный коэффициент по каждому фактору, что излишне перегрузит факторную модель и затруднит ее восприятие исследователями.

    Параметр Suppressabsolutevalueslessthanвводится, чтобы облегчить практическую интерпретацию результатов факторного анализа. Так как факторные коэффици­енты в результирующей ротированной матрице коэффициентов являются коэф­фициентами корреляции между соответствующими переменными и факто­рами, в большинстве практических случаев целесообразно устанавливать начальное значение отсечения незначимых переменных на уровне 0,5. Если в результате фак­торного анализа окажется, что число классифицированных переменных менее при­емлемого (например, если структура данных не вполне подходит для факторного анализа; см. ниже), можно пересчитать факторную модель с меньшим значением отсечения (например, 0,4). В обратной ситуации, если переменная входит в не­сколько факторов, можно предложить повысить уровень экстракции с 0,5 до 0,6. Это позволит устранить переменные, входящие сразу в несколько факторов, уве­личив практическую пригодность результатов факторного анализа.

    Итак, указав все необходимые параметры в окне Options, закройте его (кнопкаContinue) и запустите процедуру факторного анализа при помощи щелчка на кноп­ке 0К в главном диалоговом окнеFactorAnalysis.

    Рис. 5.37. Диалоговое окно Options

    После того как программа произведет все необходимые расчеты, откроется окно SPSSViewerс результатами построения факторной модели. Первое, что нас инте­ресует, — это пригодность имеющихся данных для факторного анализа в целом. Посмотрим на таблицу КМОandBarlett'sTest(рис. 5.38). В ней есть два интересую­щих нас показателя: тест КМО и значимость тестаBarlett. Результаты теста КМО позволяют сделать вывод относительно общей пригодности имеющихся данных для факторного анализа, то есть насколько хорошо построенная факторная модель описывает структуру ответов респондентов на анализируемые вопросы. Результа­ты данного теста варьируются в интервале от 0 (факторная модель абсолютно не­применима) до 1 (факторная модель идеально описывает структуру данных). Фак­торный анализ следует считать пригодным, если КМО находится в пределах от 0,5 до 1. В нашем случае этот показатель равен 0,9, что является весьма хорошим ре­зультатом.

    Barlett'stestofsphericityпроверяет гипотезу о том, что переменные, участвующие в факторном анализе, некоррелированы между собой. Если данный тест дает по­ложительный результат (переменные некоррелированы), факторный анализ сле­дует признать непригодным использовать другие статистические методы (на­пример, кластерный анализ). Статистикой, определяющей пригодность факторного анализа по тестуBarlett, является значимость (строкаSig.). При приемлемом уровне

    значимости (ниже 0,05) факторный анализ считается пригодным для анализа ис­следуемой выборочной совокупности. В нашем случае рассматриваемый тест по­казывает весьма низкую значимость (менее 0,001), из чего следует вывод о приме­нимости факторного анализа.

    Итак, на основании тестов КМО и Barlettмы пришли к выводу, что имеющиеся у нас данные практически идеально подходят для исследования при помощи фак­торного анализа.

    Рис. 5.38. Таблица КМО and Barlett s Test

    Следующим шагом в интерпретации результатов факторного анализа является рассмотрение результирующей ротированной матрицы факторных коэффициен­тов: таблицы RotatedComponentMatrix(рис. 5.39). Данная таблица является основ­ным результатом факторного анализа. В ней отражаются результаты классифика­ции переменных по факторам. В нашем случае при помощи автоматического метода определения количества факторов (на основании характеристических чисел боль­ше 1) была построена практически приемлемая факторная модель, в которой 22 из 24 переменных удалось однозначно классифицировать по небольшому числу фак­торов (5). Данный результат может считаться хорошим.

    С неклассифицированными переменными можно поступить следующим образом. Необходимо просто пересчитать факторную модель, удалив в диалоговом окне Optionsранее установленное значение отсечения 0,5. Далее будет построена фак­торная матрица (рис. 5.40), в которой аналитику предстоит самостоятельно опре­делить принадлежность неклассифицированных переменных к тому или иному фактору на основании критерия наибольшего коэффициента корреляции между переменными и пятью факторами. В нашем случае вы видите, что переменнаяql6 в наибольшей степени коррелирует с фактором 1 (факторный коэффициент 0,468) и, следовательно, должна быть отнесена к данному фактору, а переменнаяq24 — с фактором 4 (0,474).

    После того как мы однозначно классифицировали все переменные, вернемся к таб­лице на рис. 5.40. Мы получили пять групп переменных (факторов), описываю­щих текущую конкурентную позицию авиакомпании Xс пяти различных сторон. Вот эти группы.

    q2. АвиакомпанияXможет конкурировать с лучшими авиакомпаниями мира.q3. Я верю, что у авиакомпанииXесть перспективное будущее в мировой авиации.q23. АвиакомпанияX— лучше, чем многие о ней думают.q!4. АвиакомпанияX— лицо России.

    Рис. 5.39. Таблица RotatedComponentMatrix

    qlO. Авиакомпания Х действительно заботится о пассажирах.

    ql. АвиакомпанияXобладает репутацией компаний, превосходно обслуживающей пасса­жиров.

    q21. АвиакомпанияX— эффективная авиакомпания.q5. Я горжусь тем, что работаю в авиакомпанииX.

    ql6. Обслуживание авиакомпанииXявляется последовательным и узнаваемым во всем мире.

    ql2. Я верю, что менеджеры высшего звена прикладывают все усилия для достижения успеха авиакомпании.

    qll. Среди сотрудников авиакомпании имеет место высокая степень удовлетворенности работой.

    q6. Внутри авиакомпанииXхорошее взаимодействие между подразделениями.

    Рис. 5.40. Таблица RotatedComponentMatrix, содержащая все факторные коэффициенты

    q8. Сейчас авиакомпанияXбыстро улучшается.

    q7. Каждый сотрудник авиакомпании прикладывает все усилия для того, чтобы обеспе­чить ее успех.

    q4. Я знаю, какой будет стратегия развития авиакомпанииXв будущем.

    ql7. Я бы не хотел, чтобы авиакомпанияXменялась.

    q20. Изменения в авиакомпанииXбудут позитивным моментом.

    ql8. АвиакомпанииXнеобходимо меняться для того, чтобы использовать в полной мере имеющийся потенциал.

    q9. Нам предстоит долгий путь, прежде чем мы сможем претендовать на то, чтобы назы­ваться авиакомпанией мирового класса.

    q22. Я бы хотел, чтобы имидж авиакомпанииXулучшился с точки зрения иностранных пассажиров.

    q24. Важно, чтобы люди во всем мире знали, что мы — российская авиакомпания.

    ql9. Я думаю, что авиакомпанииXнеобходимо представить себя в визуальном плане бо­лее современно.

    ql3. Мне нравится, как в настоящее время авиакомпанияXпредставлена визуально широ­кой общественности (в плане цветовой гаммы и фирменного стиля).

    ql5. Мы выглядим «вчерашним днем» по сравнению с другими авиакомпаниями.

    Наиболее сложной задачей при проведении факторного анализа является интер­претация полученных факторов. Здесь не существует какого-либо универсально­го решения: в каждом конкретном случае, аналитик использует имеющийся прак­тический опыт для того, чтобы понять, почему факторная модель относит ту или иную переменную к данному конкретному фактору. Бывают случаи (особенно при малом числе хорошо формализованных переменных), когда образованные факто­ры являются очевидными и различия между переменными видны невооруженным глазом. В такой ситуации можно обойтись без факторного анализа и разбить пере­менные на группы вручную. Однако эффективность и мощь факторного анализа проявляются в сложных и нетривиальных случаях, когда переменные нельзя зара­нее классифицировать, а их формулировки запутаны. Тогда большой исследова­тельский интерес будет вызывать классификация переменных именно на основа­нии мнений респондентов, что позволит выявить то, как сами опрошенные поняли тот или иной вопрос.

    Приводим рекомендации, которые помогут вам при затруднении интерпретиро­вать результаты факторного анализа.

    Когда это возможно и приемлемо для целей исследования, следует формализо­вать переменные до проведения факторного анализа. Это позволит аналитику за­ранее сделать предположения о разделении совокупности имеющихся перемен­ных на группы. Задача исследователя при интерпретации результатов факторной матрицы в данном случае упростится, так как он уже не будет начинать «с чистого листа». Его задача сведется к проверке ранее выдвинутых гипотез о принадлежно­сти той или иной переменной к конкретной группе.

    Иногда возникают случаи, когда переменная, отнесенная SPSSк конкретному фактору, логически никак не связана с остальными переменными, составляющи­ми тот же фактор. Можно пересчитать факторную модель без отсечения незначи­мых коэффициентов (как в примере на рис. 5.40) и посмотреть, с каким еще факто­ром данная нелогичная переменная коррелирует практически с той же силой, как с фактором, к которому она была отнесена автоматически. Например, переменнаяZимеет коэффициент корреляции с фактором 1, равный 0,505, а с фактором 2 она коррелирует с коэффициентом 0,491.SPSSавтоматически относит данную пере­менную к тому фактору, с которым выявлена наибольшая корреляция, не учиты­вая при этом, что с другим фактором данная переменная коррелирует практически с той же силой. Именно в такой ситуации (при небольшой разнице в коэффициен­тах корреляции) можно попробовать отнести переменнуюZк фактору 2, и если это окажется логичным, рассматривать ее в группе переменных из второго фактора.

    Можно вручную сократить число извлекаемых факторов, что облегчит задачу ис­следователя при интерпретации результатов факторного анализа. Однако необхо­димо иметь в виду, что такое сокращение снизит гибкость факторной модели и даже может привести к ситуации, когда переменные будут ложно разделены на неверные, с практической точки зрения, группы. Также снижение числа извлекае­мых факторов неизбежно снизит и долю однозначно классифицированных факто­ров.

    В качестве варианта предыдущего решения можно предложить объединить два или более факторов с небольшими количествами входящих в них переменных. Такая группировка, с одной стороны, позволит снизить число интерпретируемых факто­ров, а с другой — облегчит понимание малочисленных факторов.

    Если исследователь зашел в тупик и никакие средства не помогают объяснить при­надлежность той или иной переменной к конкретному фактору, остается приме­нить другую статистическую процедуру (например, кластерный анализ).

    Вернемся к нашим пяти факторам. Задача их описания и объяснения представля­ется не очень сложной. Так, можно заметить, что утверждения, входящие в первый фактор (q2,q3,q23,ql4,qlO,ql,q21,q5 иql6), являются общими, то есть касаются всей авиакомпании и описывают отношение к ней со стороны авиапассажиров. Единственное исключение составила переменнаяq5, имеющая отношение скорее ко второму фактору. Коэффициент корреляции с фактором 2 — 0,355 (см. рис. 5.40), что позволяет отнести его в данную группу из соображений логики. Фактор 2 (ql2,qll,q6,q8,q7 иq4) описывает отношение к авиакомпанииXсо стороны сотрудни­ков. Третий фактор (ql7,q20 иql8) описывает отношение респондентов к измене­ниям в авиакомпании (в него попали все утверждения, имеющие корень «мен» — от слова «изменение»). Четвертый фактор (q9,q22 иq24) описывает отношение респондентов к имиджу авиакомпании. Наконец, пятый фактор (ql9,ql3 иql5) объединяет утверждения, характеризующие отношение респондентов к визуаль­ному образу авиакомпанииX.

    Таким образом, мы получили пять групп утверждений, описывающих текущую конкурентную позицию компании Xна международном рынке авиаперевозок. На основании проведенного интерпретационного (семантического) анализа можно присвоить данным группам (факторам) следующие определения.

    ¦ Фактор 1 характеризует общее положение авиакомпании Xв глазах ее клиентов.

    ¦ Фактор 2 характеризует внутреннее состояние авиакомпании Xс точки зрения ее сотрудников.

    ¦ Фактор 3 характеризует изменения, происходящие в авиакомпании X.

    ¦ Фактор 4 характеризует имидж авиакомпании X.

    ¦ Фактор 5 характеризует визуальный образ авиакомпании X.

    После того как мы успешно интерпретировали все полученные факторы, можно считать факторный анализ завершенным и удавшимся. Далее мы покажем, как можно использовать результаты факторного анализа для построения разрезов.

    Вспомним о том, что мы сохранили факторные рейтинги (то есть принадлежность каждого респондента к определенному фактору) в исходном файле данных в виде новых переменных. Эти переменные имеют имена типа: facX_Y, гдеX— это номер фактора,aY— порядковый номер факторной модели. Если мы строили факторную модель дважды и в результате в первый раз было извлечено три фактора, а во второй — два, имена переменных будут следующими:

    ¦ facl_l,fac2_l,fac3_l(для трех факторов из первой построенной модели);

    ¦ facl_2,fac2_2 (для двух факторов из второй модели).

    В нашем случае будет создано пять новых переменных (по числу извлеченных фак­торов). Эти факторные рейтинги в дальнейшем могут использоваться, например, для построения разрезов. Так, если необходимо выяснить, каким образом респон­денты — мужчины и женщины — оценивают различные стороны деятельности авиа­компании X, это можно сделать при помощи анализа факторных рейтингов.

    Наиболее частый способ использования факторных рейтингов в дальнейших рас­четах — это ранжирование и последующее разделение вновь созданных перемен­ных, обозначающих извлеченные факторы, на четыре квартиля (25%-проценти-ля). Такой подход позволяет создать новые переменные с порядковой шкалой, описывающие четыре уровня каждого фактора. В нашем случае для утверждений, составляющих фактор 2, такими уровнями будут: не согласен (состояние внутрен­них дел компании не удовлетворяет сотрудников), скорее не согласен (оценка внут­ренней ситуации в компании ниже среднего), скорее согласен (оценка выше сред­него), согласен (оценка отлично).

    Чтобы создать переменные, по которым далее будут группироваться респонденты, вызовите меню Transform>RankCases. В открывшемся диалоговом окне (рис. 5.41) из левого списка выберите переменную, содержащую факторные рейтинги для фактора 2 (fac2_l), и поместите ее в полеVariables. Далее в областиAssignRankItoвыберите пунктSmallestvalue, в нашем случае это означает, что первую группу (не согласен) составят респонденты, оценивающие состояние внутренних дел авиаком­пании как плохое. Соответственно группы 2, 3 и 4 будут определены для катего­рий скорее не согласен, скорее согласен и согласен соответственно.

    Рис. 5.41. Диалоговое окно RankCases

    Щелкните на RankTypes>Types, отмените установленный по умолчанию параметрRankи вместо него выберитеNtilesс предустановленным числом групп, равным 4 (рис. 5.42). Щелкните на кнопкеContinueи затем в главном диалоговом окне на ОК. Данная процедура создаст в файле данных новую переменнуюnfac2_l(2 означает второй фактор), распределяющую респондентов на четыре группы.

    Рис. 5.42. Диалоговое окно Types

    Все респонденты в выборке характеризуются положительным, скорее положитель­ным, скорее отрицательным или отрицательным отношением к текущему состоя­нию дел в авиакомпании X. Для повышения наглядности рекомендуется присво­ить метки каждому из выделенных четырех уровней; можно переименовать и саму переменную. Теперь вы можете проводить перекрестный анализ при помощи но­вой порядковой переменной, а также строить другие статистические модели, пре­дусмотренные вSPSS. Ниже будет показано, как использовать результаты постро­ения факторной модели в кластерном анализе.

    Для иллюстрации возможностей практического использования новой переменной проведем перекрестный анализ влияния пола респондентов на их оценку текуще­го состояния дел в авиакомпании X(рис. 5.43). Как следует из представленной таблицы, респонденты-мужчины в целом склонны ставить более низкие оценки рассматриваемому параметру авиакомпании по сравнению с женщинами. Так, в структуре оценок очень плохо, плохо и удовлетворительно доля мужчин преобладает; в оценках очень хорошо, напротив, преобладают женщины. При переходе в каждую следующую (более высокую) категорию оценок доля мужчин равномерно убыва­ет, а доля женщин, соответственно, возрастает. Тест %2 показывает, что выявлен­ная зависимость является статистически значимой.

    Рис. 5.43. Перекрестное распределение: влияние пола респондентов на их оценку текущего состояния дел в авиакомпании X

    5.2.2. Иерархический кластерный анализ

    В статистике существует два основных типа кластерного анализа (оба представле­ны в SPSS): иерархический и осуществляемый методомk-средних. В первом случае автоматизированная статистическая процедура самостоятельно определяет опти­мальное число кластеров и ряд других параметров, необходимых для кластерного

    анализа. Второй тип анализа имеет существенные ограничения по практической применимости — для него необходимо самостоятельно определять и точное количе­ство выделяемых кластеров, и начальные значения центров каждого кластера (цен­троиды), и некоторые другие статистики. При анализе методом k-средних данные проблемы решаются предварительным проведением иерархического кластерного анализа и затем на основании его результатов расчетом кластерной модели по мето­дуk-средних, что в большинстве случаев не только не упрощает, а наоборот, услож­няет работу исследователя (в особенности неподготовленного).