11.4. Обработка первичной социологическойинформации, анализ результатов исследования.Квантификация и шкалирование
Проведение конкретных социологических исследований в сфере труда 325
ванием компьютерной техники.
Основные зтаяы обработки первичной информации следующие.Первый этап. Разрабатываются логическая схема обработки и анализа получаемых данных. В ходе этого этапа устанавливаются формы документов для сбора информации, методы ее кодирования для ручной и машинной обработки, методы контроля данных и устранения ошибок. Определяются порядок и методы обработки данных, алгоритм расчетов, разрабатываются система анализа полученных в ходе обработки данных, основные направления анализа.
Второй этап. В случае обработки данных компьютерными методами осуществляется разработка математического обеспечения, выясняется, какие необходимы программы для обработки материалов исследования, иногда разрабатывается новое программное обеспечение.
Третий этап. Подготовка данных первичной социологической информации к обработке. Работа эта очень трудоемка. Так, при обработке данных анкетирования открытые вопросы анкет «закрывают» — классифицируют по определенным признакам, систематизируют и кодируют в соответствии с классификацией. Осуществляют проверку анкет на качество заполнения. Эта проверка включает три момента:
• на полноту заполнения (ответ может отсутствовать изза нежелания респондента отвечать, непонимания им вопроса, небрежности в заполнении анкеты). При невозможности устранить ошибку отдельные вопросы или вся анкета изымается из обработки. Часто устанавливают «критерий полноты заполнения», например, процент незаполненных вопросов анкеты, при превышении которого она будет изъята из обработки. В случае большого изъятия, ставящего под сомнение репрезентативность выборки, возможно возникновение необходимости дополнительного сбора исходных данных;
• на надежность (определяется отклонение от репрезентативной выборки, с помощью контрольных и фильтрующих вопросов проверяется качество информации, устраняются противоречивые ответы, умышленно недостоверные, отфильтровываются ответы или анкеты лиц, некомпетентных в исследуемых вопросах и т д.);
• на технологичность (удобство обработки).
Все ответы необходимо привести к виду, дающему возможность легко перенести12 Экономика и социология труда
Проведете*
326
: исследований в сфере труда 327
информацию на машинный носитель для обработки. Из анкет убирают все пометки, которые можно неоднозначно трактовать, номера (шифры) выбранных ответов четко обводятся ручкой.
Далее подсчитывают все документы, входящие в обрабатываемый массив информации, каждому присваивается порядковый номер. Информация кодируется, т.е. категориям документа присваиваются условные обозначения (шифр, код). Если все вопросы анкеты закрытые, кодирование может осуществляться в ходе ее разработки. При наличии полузакрытых и открытых вопросов кодировать информацию возможно только после их «закрытия». Закодированную информацию переносят на машинные носители, контролируют качество переноса и устраняют ошибки.
Четвертый этап. Обработка информации (расчет средних величин, установление корреляционных связей, составление группировок, таблиц, графиков и пр.)
Рассмотрим некоторые из перечисленных методов. 1. Простые вариационные ряды. Пусть варьируемый признак (варианта) Xt — стаж. Объем анализируемой совокупности — 8 чел. Тогда частота проявления признака — л„ т.е. количество человек из данной совокупности с данным стажем. Вариационный ряд будет выглядеть так: Листаж, лет)
5
6
7
8
9
10
л, (чел.)
1
0
1
2
0
4
Здесь важно выбрать оптимальную величину интервала (более 20 групшфовочных интервалов делать не рекомендуется). Величина интервала определяется по формуле:
Y У.
А
"^х •дщщ 3,21g/i '
— соответственно максимальное и минимальное значения варианты в ис
следуемой совокупности; л — величина анализируемой совокупности; lg — десятичный логарифм; Л —величина интервала.
401
Приму. Численность работников составляет 1000 чел., максимальный стаж работы на данном предприятии — 40 лет, минимальный — 1 год,
интервал'
= 3,69 лет. 1 + 3,2 х 3
Тогда интервалы могут быть установлены следующим образом:
до 1 года;
1+3,69 = 4,69 «5 лег,
4,69 + 3,69 = 8,38 8 лег,
8,38 + 3,69 = 12,07 ~ Плетитд.
Могут применяться как равные, так и неравные интервалы.
3. Расчет средних величин. Средняя величина представляет собой абстрактную характеристику всей анализируемой совокупности. а) Среднеарифметическая величина рассчитывается по формуле:Помимо частоты распределения варьируемого признака, можно определить его частость (/я,), т.е. долю частоты в общем объеме совокупности. Так, частость 6й варианты (стаж 10 лет) составит:
т* = ^
= 0,5 (или 50%).
8 чел.
2. Интервальные вариационные ряды. Пример интервального вариационного ряда: Xj (стаж, лет)
до 1 года
Свыше 1 до 5 лет
Свыше 5 до 8 лет
Свыше 8 до 12 лет
ит.д.
«,(%)
20,7
10,5
8,4
15,2
ИТ.ХУ
где AJ — сумма значений варьируемого признака; 2л, — сумма всех членов совокупности.
Прикр. Если взять за основу данные приведенного выше простого вариационного ряда, то среднеарифметический стаж составит
5 + 6 + 7 + 8 + 9 + 10.„
л = ————— ————— = 5,62 года.
о
б) Среднеарифметическая взвешенная величина учитывает частоту проявления признака, последняя выступает в качестве весов. Расчет ведется по формуле:
12»
11
328
: «мриммкчечжкг «ссдеймшиш в сфере труда 329
Пример. В нашем случае среднеарифметическая взвешенная стажа составит.
і = 84 лет.
5x1+6x0+7;
Л — ———^—————
8
в) Для расчета средних величин по коэффициентам используется среднегеометрическая величина, рассчитываемая как корень nй степени из произведения п коэффициентов.
Прмер. Имеется 4 коэффициента, характеризующих текучесть кадров в четырех подразделениях предприятия: АІ = 0,85; Кг = 0,9; К3 = 0,4; ? = 0,6. Тогда средний коэффициент по четырем подразделениям, рассчитанный как среднегеометриче
ская величина, составил $0,85 х 0,9 х 0,4 х 0,6 = 0,65.
г) Определение медианы — значения признака у той единицы совокупности, которая расположена в середине упорядоченного ряда. Если число членов ряда четное, то медиана определяется как среднеарифметическое из двух серединных значений.
Пример. Имеется упорядоченный ряд: № работника
1
2
3
4
5
6
7
8
стаж
20
16
10
8
7
5
3
1
8 + 7 Медиана равна: —— = 7,5 лет.
Если число членов ряда нечетное, то за медиану принимается значение признака у среднего члена ряда.
Пртир.
Если в рассмотренном простом вариационном ряду не было бы 8го работника, медиана быта бы равна значению величины стажа у 4го работника, т.е. 8 лет.д) Определение моды — наиболее часто встречающегося значения признака (варианты с наибольшей частотой).
Пример. На основе приведенного выше простого вариационного ряда можно определить моду как 10 лет (численность работников с данным значением стажа в анализируемой группе наибольшая).
4. Расчет показателей вариации (колеблемости) признака, оценивающих «разброс» его значений в анализируемой совокупности.
а) Среднее линейное отклонение рассчитывается как средняя арифметическая величина из абсолютных величин отклонения значений признака от его среднеарифметического значения:
где % — величина гго значения признака;
X — среднеарифметическое значение признака;
и — общее количество значений признака (единиц совокупности).
б) Дисперсия признака — величина, равная среднему значению квадрата отклонений отдельных значений признака от его средней арифметической величины:
82 =
К*,*)2
в) Коэффициенты вариации (степень рассеяния) признака рассчитываются как отношение среднего линейного или среднего квадратического (дисперсия) отклонения к средней арифметической величине его значения.
5. При анализе данных социологического исследования используются статистические таблицы на основе группировок. Здесь главное — правильный выбор группировочных признаков. Эти таблицы могут быть:
а) простые — перечень всех единиц совокупности с количественной или качественной характеристикой каждой;
б) групповые — единицы совокупности группируются по одному признаку,
в) комбинационные»— единицы совокупности группируются по 2м и более признакам.
б. В ходе анализа могут быть использованы графики, наглядно отражающие распределение исследуемых признаков. Это по существу графическое изображение интервального ряда.
а) Гистограмма на основе данных простого вариационного ряда
01234 и т.д. Значение признака (стаж), лет
Частость, % * 100755025.
и
330
б) Гистограмма на основе интервального вариационного ряда (общее число единиц совокупности — работников со стажем, входящих в тот или иной интервал, — характеризуется площадью прямоугольников). Число еда ' ниц сово 5 купности, приходя 4 щееся на интервал, з чел.
21
1
L
^•^н
Э 1 5 10 и т.д. Стаж, лет
в) Полигон распределения.
Частота или * частость признака (чел. или %)
>
І
' ' \
/ І І ІЧ.
t — І —— І — І — І — І — Т— ».
0123456 Значение признака (разряд рабочего), лет
7. Изучение статистических зависимостей. Здесь применяются корреляционный анализ (установление формы, направления, плотности взаимосвязи нескольких признаков); регрессионный анализ (анализ изменения значений результирующего признака в зависимости от влияния на него признаковфакторов); факторный анализ (оценивает вариации признаков и внутренние взаимосвязи).
Помимо перечисленных методов статистического анализа, используются и иные методы. Функциональный анализ нацелен на выявление устойчивых взаимосвязей. Структурный анализ определяет внутренние элементы объекта исследования и их сочетания.
Проведение конкретных соыивлланескых исследований в сфере труда 331
Генетический выявляет фазы развития объекта исследования, устанавливает причинные связи. В ходе системного анализа осуществляется целостное изучение объекта, а также описание его в системе влияющих на его состояние факторов. Логлннейный анализ — это поиск и оценка взаимосвязей в аналитической или группировочной таблице, сжатое описание табличных данных. Задача латентного анализа — определение не поддающихся наблюдению, скрытых от внешнего взгляда признаков.
В ходе сбора и обработки данных социологического исследования нередко встает вопрос об измерении социологических характеристик, не имеющих числового выражения (мнения, оценки, суждения и т.п.). Чтобы решить эту проблему, применяется процедура квантифнктаю, т.е. придания качественным признакам количественной определенности.
Для того чтобы измерить социальное свойство, необходимо найти «индикатор» измерения — внешний признак его проявления. В качестве индикаторов могут выступать и варианты ответов на вопросы, а инструментом измерения является шкала. В ходе разработки шкалы сначала определяется ее континуум (продолжительность) от наиболее сильного варианта признака (проявления социального свойства) к наиболее слабому. Затем шкала градуируется, т.е. дробится на определенные части: «полностью удовлетворен» — «удовлетворен» — «скорее удовлетворен, чем не удовлетворен» — «скорее не удовлетворен, чем удовлетворен» — «не удовлетворен» — «совершенно не удовлетворен».
Применяются следующие типы шкал.
Номинальная (неупорядоченная) шкала наименований представляет собой перечень характеристик объекта или явления. Она позволяет осуществить группировку характеристик по различным признакам. С ее помощью можно найти частоты распределения признаков, определить моду или модальную величину (выявить группу наибольшей численности по какомуто признаку), рассчитать коэффициенты сопряженности по двум признакам (пол — причина увольнения).
Ранговая шкала (шкала порядка) упорядочивает проявление свойств от большего к меньшему или, наоборот, от меньшего к большему. Так, если мы выстроим мотивы увольнений работников по собственному желанию в порядке от мотивов большей значимости
Глава 11
Првееве
еааос исследований в сфере труда 333
332
к мотивам меньшей значимости, то также получим ранговую шкалу. Ранговая шкала позволяет определить ранговую корреляцию — связь в двух рядах признаков, дисперсию признака, средневзвешенные величины, индексы.
Интервальная (метрическая) шкала образуется на основе ранговой путем присвоения баллов ее делениям.
По форме шкалы могут быть:
вербальные (словесныеутверждения);
числовые (баллы);
графические: согласен не знаю не согласен
І————————І——————————І
На графической шкале респондент должен указать место, соответствующее степени проявления признака (в нашем случае — степень согласия);
смешанные.
При конструировании шкалы используются различные методы.
1. Метод прямого измерения — оценка свойства проводится респондентом путем выбора ответа из серии предлагаемых, которым приписывается числовое значение. Иногда для этих целей используется графическая шкала, где крайние значения обозначены, допустим, 5 и 1, середина — 3; или крайние значения — от +1 до —1, середина — 0.
2. Метод ранжирования. Упорядочив объекты по степени выраженности анализируемого признака, приписываем им числовую оценку по месту в данном ранжированном ряду.
3. Метод попарных сравнений. Объекты сравнения ранжируются в зависимости от количества выборов, полученных в ходе всех сравнений.
4. Метод равных интервалов. Опрашиваемым, чаще экспертам, выдается заранее составленный список суждений с тем, чтобы расположить их в фиксированное число (обычно 7—11) категорий по значимости. При этом эксперты должны считать, что интервалы, т.е. отличия одного суждения от другого, равны. Порядковый номер категории присваивается суждению в качестве ранга.
Существуют и другие, более сложные методы конструирования
шкал.
Основное требование к шкале — ее надежность. Понятие надежности шкалы включает три ее характеристики:
• обоснованность (валядность) — шкала способна измерять именно заданное социальное свойство;
• полнота — в шкале учтены все варианты индикатора (признака проявления свойства);
• чувствительность — способность шкалы дифференцировать степень проявления социального свойства.
В какойто мере к инструментам квантификации можно отнести социологические индексы, используемые для характеристики совокупности свойств исследуемого объекта. В отличие' от статистических индексов, отражающих динамику явления, социологические оценивают качественное его состояние на конкретный момент.
Заключительная часть анализа данных социологического исследования — составление отчета, который отражает содержание программы исследования, ее выполнение, полученные выводы, содержит практические рекомендации и оценивает возможности их внедрения, ожидаемые социальные и экономические результаты использования практических предложений