Изображения страниц
PDF

может характеризоваться целым комплексом показателей. Поэтому для выбора какой-либо губернии из типического района наиболее реальным способом отбора является направленный метод. Это не математический, а чисто умозрительный способ, когда типическая единица извлекается из типического района с помощью определенной системы доводов. Считается, что надлежащим образом обоснованный направленный метод дает выборку более репрезентативную, чем другие способы отбора. Тем не менее на практике направленным методом избегают пользоваться, так как он не дает возможности измерить ошибки оценки". В нашем случае материалы отдельных губерний, взятые в качестве представительных частей тех или иных типических районов, представляют интерес и как самостоятельные объекты анализа. Выступая в качестве самостоятельных совокупностей, эти материалы позволяют пользоваться по отношению к ним математическим аппаратом выборки. Сочетание направленного способа выборки губерний из типических экономических районов и механического отбора анкет из этих губерний является наиболее эффективным методом выборочной обработки профессиональной переписи 1918 г. Следующий этап исследования — определение доли механического отбора из материалов отдельных губерний. Обычно для определения необходимого объема выборки производится пробная выборка по одному или по ряду изучаемых признаков и анализируется распределение этих признаков. Зная распределения, можно с помощью формул установить объем требуемой выборки. Такой способ в целом неприемлем для обработки переписи 1918 г., так как количество признаков, подлежащих изучению, слишком велико, даже если их намеренно ограничить лишь кругом поставленных задач. Следует обратить внимание на то, что при определении представительной выборки по отдельным признакам теряется аспект органической взаимосвязи факторов и естественного соотношения структурных элементов совокупности, присущий выборке с единой долей отбора. Для всей выборочной обработки переписи в качестве исходного выДВИГается ПОЛОЖеНИе, ЧТО, ecЛИ ПОСТаВЛеНа Цель ВЫЯВЛения социальных групп рабочего класса, то до проведения эксперимента, дающего эмпирическое представление о структуре изучаемого объекта, выборка не может быть строго обоснована. Таким образом, при определении путей выборочной обработки переписи оказалось необходимым проведение экспериментального исследования вместо обычной пробной выборки, дающей представление о распределении одного или нескольких признаков. Кроме того, в отличие от пробной выборки, для которой берется какая-то целая часть совокупности (обычно небольшая), экспериментальное исследование должно было удовлетворить ряду требований. В нем по возможности было необходимо отразить многообразие социальных условий страны, в него должны были войти полярные с точки зрения анализа социального состава группы рабочего класса. Экспериментальное исследование должно было охватить весьма представительную часть совокупности, поскольку любая небольшая ее часть может дать не действительные, а исключительные распределения признаков. Для проведения выборочного эксперимента были избраны материалы Ярославской и Воронежской губерний. Материалы Ярославской губернии претендуют на характеристику рабочего класса развитого промышленного района. Сравнительно малонаселенная Ярославская губерния занимала пятое место по числу рабочих

}, напр., Дж. Э. Юл., М. Дж. Кенд эл. Теория статистики. М., 1960, стр. 43o.

6 История СССР. No 4

среди остальных губерний, включенных в перепись. В ней было представ лено 17, причем основных, из 22 тогдашних групп производств фабрично заводской промышленности. Преобладание здесь текстильщиков был характерным для пролетариата всего Московского промышленного рай она, однако меньшая связь с землей (14,7%) * и значительная доля дру гих профессиональных отрядов наводит на мысль о наличии в рабоче: классе губернии в тот период специфических черт, сближающих его пролетариатом соседних районов. Значительное число эвакуированны в годы войны и революции заводов (среди них: автомобильные б. Лебедева и «Русский Рено» из Петрограда, вагоностроительный завод «Фе: никс» из Риги и пр.) представляли рабочих других промышленных рай. онов страны". Материалы Воронежской губернии должны были дать представление о рабочих сельскохозяйственного района. Предполагалось, что по мате риалам этой губернии можно ближе познакомиться со слоем формирую щихся рабочих, так как в губернии в тот период имелось значительночисло сезонных предприятий и была велика связь рабочих с земле: (44,6%) 20. Для определения необходимой доли отбора, обеспечивающей достаточно точную и представительную оценку признаков, в рамках экспериментального исследования было решено взять несколько выборок из ан: кет Ярославской губернии. С этой целью из первичных материалов ме ханическим способом были отобраны каждые /o, /2o и "/roo анкеты (10 5% и 1% выборки). Из совокупности примерно в 37 500 единиц выборки соответственно составили 3300, 1600 и 380 единиц. Из анкет Воронежской губернии (примерно 6400 единиц) была сделана только одна выборка в '/lo объема (несколько меньше 600 единиц) *. Анкеты для обработки отбирались ручным способом. Для контроля за долями отбора использовалась нумерация анкет в рамках отдельных предприятий. Совершенно незаполненные анкеты, попавшие в точки отбора, не обрабатывались вместо них брались соседние анкеты, если они были заполнены. Тем не менее в больших массивах незаполненных анкет не удалось избежать пропусков. Интервалы отбора не смещались и оставались постоянными на все время обработки. Исходя из анализа эмпирических распределений признаков в выбор. ках различных объемов определялся оптимальный вариант, обеспечиваю. щий представительность анализируемых групп. Выборочный эксперимент давал возможность оперировать сравнительно большими объемами выборок. В статистике, например, считается, что выборка в 1000 единиц уже обеспечивает высокую точность оценки признаков и представительность основных групп *. Однако это заключение нельзя принять для любого массива информации. Так, например, в нашем случае требуется эмпири

[ocr errors]

** См. «Всероссийская промышленная и профессиональная перепись 1918 г. ... Тру. ды ЦСУ», т. XXVI, вып. 2, стр. 122. * Общую характеристику рабочего класса Ярославской губернии см. М. Г. Мейерович. О происхождении промышленных рабочих Ярославской губернии (конец XIX—начало XX в.). «Вестник МГУ», серия IX, история, No 6, 1969; Н. Ф. оруева Состав и положение рабочих Ярославской и Костромской губерний в начале XX века «УЗ Омского гос. пед. ин-та», вып. 22, Омск, 1965. * «Всероссийская промышленная и профессиональная перепись 1918 года... Тру. ды ЦСУ», т. XXVI, вып. 2, стр. 122. * Действительные объемы выборок оказались несколько меньше предусмотренных пропорциями отбора, так как для обработки не брались незаполненные анкеты. Тем не менее отсутствие сведений по тому или иному вопросу характерно и для многих анкет, взятых для обработки. Это необходимо учесть при анализе таблиц, полученных в ходе выборочной обработки. * См. Дж. Э. Юл, М. Дж. Кендэл. Указ.соч., стр. 445.

[merged small][merged small][ocr errors][ocr errors][ocr errors][ocr errors][merged small][ocr errors][ocr errors][ocr errors]
[ocr errors]

г р у п т ь п р о и 3 в о д с т в Рис. 1 10%-ная выборка профессиональной переписи, — — 5%-ная выборка профессиональной переписи, —————— 1%-ная выборка профессиональной переписи, . . . . . . промышленная перепись 1918 г.

Группы производств: VII — обработка камней, земель и глин; VIII — горная и горнозаводская промышленность; IX—X — металлообработка и машиностроение; XI — деревообработка; XII — химическая промышленность; XIII — пищевая промышленность; XIV — обработка продуктов животного происхождения; XV — обработка кожи; XVI — обработка хлопка; XVII — обработка шерсти; XIX—обработка льна; XX обработка пеньки; XXII — одежда и туалет; XXIII — обработка бумаги; XXIV — полиграфия; XXVI — передача физических сил и водоснабжение

ческая оценка распределения значительного числа признаков, имеющих иногда очень дробные и изменчивые значения. Несколько выборок из одной совокупности значительно повышают точность оценки изучаемых признаков и в случае незначительных отклонений этих оценок (расчет допустимых отклонений производится с помощью специальных методов математической статистики) приближают эту относительную точность к практически полной достоверности. Информация, заключенная в анкетах экспериментального выборочного исследования, была соответствующим образом закодирована и обработана на ЭВМ. Работой на этой стадии руководил специалист в области применения ЭВМ в исторических исследованиях В. А. Устинов. В ходе этой обработки были получены так называемые безусловные (простые) распределения информации по всем показателям анкеты в разного рода выборках. На основе этих распределений можно было решать вопросы представительности групп по значениям большинства Признаков. Большинство признаков в исследовании являются качественными. Чтобы наглядно представить характер их распределения в различных выборках, приводятся гистограммы распределения по группам производств рабочих Ярославской губернии (рис. 1), построенным по данным табл. 1. Распределение по группам производств содержит наибольшее количество значений. Это распределение имеет важное значение с точки зрения контроля за выборочной методикой, поскольку материалы губерний располагаются по группам производств. Распределение по группам производств содержат опубликованные данные промышленной переписи

[graphic]
[merged small][merged small][merged small][ocr errors][merged small][merged small]

Визуальное сопоставление гистограмм распределений признаков в различных выборках несомненно свидетельствует о том, что все выборк принадлежат одной совокупности. Визуально сопоставлялись гистограм: мы распределений и других качественных признаков для тех же выборох и в каждом случае характер расположения столбцов был приблизитель

* При анализе таблиц следует учитывать, что итоги не всегда равны 100% из-з округления отдельных значений в процессе обработки на ЭВМ. Однако заметног Влияния на точность данных выборочной обработки это не оказывает.

но одинаков. Лишь иногда наблюдались расхождения с опубликованными данными, что, однако, следует отнести не за счет ошибок выборочного метода, а в большей мере за счет ошибок регистрации**. Визуальный способ сопоставления различных выборок является приблизительным и имеет тот недостаток, что не дает возможности измерить, насколько допустимы отклонения значений признаков в отдельных выборках от истинных значений, а, значит, насколько представительны их показатели.

Для оценки ошибок выборки и построения на их основе доверительных интервалов существуют несложные формулы математической статистики. Доверительные интервалы для истинных значений признака строятся из расчета: значение признака в выборке+средняя ошибка оценки. При этом устанавливается уровень вероятности, с которой можно судить о точности выборочных параметров. Для данного исследования в целом был задан довольно высокий уровень вероятности равный 0,95 (95%). Это означает, что вероятность выпадения истинного значения признака из заданных пределов (доверительного интервала) составляет всего 5%.

Доверительные интервалы“, вычисленные по данным табл. 1 для процентных долей рабочих различных групп производств Ярославской губернии и приведенные в правой части этой таблицы, взаимно пересекаются, т. е. значения интервала одной выборки включают значения интервалов других выборок. Иногда доверительные интервалы меньшей выборки включают целиком доверительные интервалы более точной — большой выборки.

Пересечение доверительных интервалов уже точно доказывает, что выборки принадлежат одной совокупности. Приводимые в той же таблице данные промышленной переписи 1918 г. иногда несколько отличаются от выборочных показателей. Поэтому при использовании данных промышленной переписи в качестве вспомогательной информации для выборочной обработки переписи необходимо учитывать возможность частичных отклонений *.

** Они обусловлены неправильным установлением фактов в анкетах профессиональной переписи и были возможны и при первой обработке переписи. На ряд таких ошибок указано ниже.

** Оценка ошибок выборки для доли признака производится по формуле: А= y 1— и = 1 оси гр, где A — средняя ошибка оценки; 1,96 — значение распределения

Стьюдент ("af) для больших выборок и степени достоверности в 95%; p — изучаемая

выборочная ДОЛЯ; п — КОЛИЧество eДИНИЦ В выборке. Формула доверительного интерваЛа, исходя из этого:

[ocr errors]

* В отношении данных по Ярославской губернии, приводимых в табл. 1, причина отклонений обнаруживается большей частью довольно легко. Так, расхождение в оценке числа рабочих в группе XII (химическая промышленность) объясняется тем, что профессиональная перепись, проведенная несколько позже промышленной, в отличие от последней, не зафиксировала рабочих на большинстве лакокрасочных заводов, свернувших производство осенью 1918 г. В XVII группе (шерстяная промышленность) в момент проведения профессиональной переписи работала вигонепрядильная фабрика Ярославского ГСНХ (бывш. т-ва Волжской прядильной мануфактуры), имевшая свыше 1000 рабочих (по оценке промышленной переписи работало всего 183 рабочих). В группе XXII (одежда и туалет) к моменту профессиональной переписи действовала крупная сапожная артель, созданная для борьбы с безработицей. Примерно также обстоит дело с расхождениями данных промышленной и профессиональной переписей в Воронежской губернии. Например, профессиональной переписью был зарегистриро

ван Острогожский кожевенный завод (гр. XV), не вошедший в промышленную перепись.

« ПредыдущаяПродолжить »