"Коммунистический университет на дому", №7, 1925 год, стр. 132-148

СТАТИСТИКА

Н. НОВОСЕЛЬСКИЙ

ЛЕКЦИЯ ШЕСТАЯ.
О статистической сводке.

(Продолжение).

В прошлой (пятой) лекции мы приступили к рассмотрению второй стадии (ступени) статистического исследования, каковой является, как мы видели, статистическая сводка. В это понятие мы включили как табличную сводку полученных при статистическом наблюдении (первой стадии статистического исследования) материалов, так и вычисление на их основе производных статистических величин (относительных и средних). Получение производных величин представляет собою как бы естественный мостик для перехода к третьей и последней ступени статистического исследования — так наз. научной разработке статистических материалов. Об этом, однако, речь еще впереди. В настоящей же беседе мы продолжим обсуждение основных вопросов статистической сводки. Из этих вопросов мы успели в предыдущей лекции рассмотреть — значение и задачи статистической сводки в целом, а также — цели и приемы критической (вторичной) проверки статистического материала. При этом мы отметили, в частности, что вторичная критическая проверка служит как бы преддверием табличной сводки и является, вместе с тем, одним из основных средств для поднятия качества статистической работы.

Погрешности статистического материала.

Мы именно потому и остановились с известной подробностью на изложении методов критической проверки материала, что в статистике — как и в промышленности — качество играет первостепенную роль. Продолжая это сравнение, можно сказать, что в обоих случаях недоброкачественность сырья может явиться решающим моментом для достоинства изделия. Тем важнее своевременное принятие всех необходимых мер для обеспечения хорошего качества сырого материала — в том числе и статистического, получаемого в результате статистического наблюдения и поступающего, после вторичной критической проверки, в табличную сводку. А при дальнейшей обработке статистического материала — возможность улучшения сырья сходит на нет, — когда этот материал принимает форму разного рода итогов, средних, коэффициентов и т. п.

Вместе с тем, статистический материал, «вываренный в статистическом котле», сгруппированный и обработанный, находящийся «в готовом виде» — по своему внешнему состоянию не всегда обнаруживает те погрешности, которые оказывали на него иной раз столь сильное влияние. В этих случаях, по замечанию французского статистика Льесса, статистические цифры бывают подобны тем социально опасным суб'ектам с уголовным прошлым и настоящим, которые столько раз изменяли (по документам) свое имя, фамилию, возраст, занятие и т. д., что выявить их подлинное «лицо» бывает под силу лишь специальным отделениям уголовного розыска. Между тем, статистический материал должен иметь безукоризненный удостоверяющий происхождение и положение документ. Этим сравнением мы желали бы обратить внимание читателя-слушателя на следующее.

Мы заимствуем и на этот раз нашу аналогию (сопоставление) из области промышленно-производственной. Так, на изделиях, — хотя бы химической промышленности, — обычно обозначается наименование — коммерческое и научное данного продукта, формула, %-ное содержание продукта (чистота — когда дело идет о простых телах). Лица, пользующиеся готовыми статистическими данными, в большинстве случаев не располагают теми средствами, какие имеются в распоряжении потребителей химических продуктов: они не могут во всякий момент проверить их, произвести анализ.

Поэтому, особенно важно при обнародовании статистических материалов — точно и, по возможности, исчерпывающим образом излагать происхождение печатаемых данных, а также отмечать те неустранимые и оставшиеся неустраненными недочеты, которые содержатся в материале. Первая часть этого требования (указание происхождения, источника цифр) обычно до известной степени выполняется при публикации статистических таблиц, сборников статистических сведений и т. п. изданий. Но вторая часть (характеристика данных в отношении их достоверности и погрешности) — к сожалению, осуществляется, вообще говоря, лишь при составлении каких-либо сводных работ или исследований по отдельным вопросам.

Возьмем, напр., первую по порядку таблицу из «Статистического справочника по Ленинграду и Ленинградской губ.» на 1924 год.

Таблица эта отражает изменение численности населения г. Ленинграда за время с 1764 по 1924 год и имеет следующий вид1.

Табл. № 1.
Население Ленинграда.
ГОДЫ Среднее на-
селение
в тысячах.
ГОДЫ Среднее на-
селение
в тысячах.
1764 149,7 1910 1.881,3
1770 158,8 1911 1.950,3
1780 174,8 1912 2.035,6
1790 218,2 1913 2.124,6
1800 220,2 1914 2.217,5
1810 291,0 1915 2.314,5
1820 385,4 1916 2.415,7
1830 435,5 1917 2.300,0
1840 472,8 1918 1.469,0
1850 487,3 1919 900,0
1860 506,6 1920 740,0
1870 682,3 1921 830,0
1881 928,0 1922 960,0
1890 1.016,0 1923 1.085,0
1900 1.418,0 1924 1.186,6
Примечание. Данные относятся с 1764 по 1880 гг. к городу и с 1881 г. к городу с пригородами.

Помимо только что приведенного примечания, в конце «Справочника» имеется к этой таблице особое дополнительное примечание, которое гласит: «Источниками данных являются: 1) ревизии 1765, 1800, 1812, 1817, 1837, 1850 и 1858 г.г., 2) полицейские исчисления за 1780, 1789, 1825, 1833 и 1854—1857 г.г. и исчисления Городской Управы за 1888, 1889, 1906 и 1915 г.г., 3) городские переписи 1864, 1869, 1881, 1890, 1900, 1910 и 1918. г.г., 4) всероссийские переписи 1897, 1920 и обще-городская — 1923 г. Население с 1890 по 1924 г.г. приведено к середине года, в предположении геометрического прироста».

В сущности, подобного рода примечание является тем максимумом, дальше которого издатели сборников статистических таблиц обычно и не идут. Лишь при печатании целой серии таблиц, чем либо об'единенных друг с другом в отношении происхождения (напр., результаты переписи) — в особом предисловии или послесловии характеризуется степень достоверности печатаемых данных и условия их собирания и подсчета.

Между тем, тщательное установление всех недочетов статистического материала имеет большое значение для суждения о том, насколько удовлетворительно проведена статистическая операция, какие именно имеются в материале дефекты. Поэтому, при работе над проверкой и табличной сводкой материала, следует иметь в виду изложенные только что замечания и неуклонно фиксировать (отмечать) выявляемые недочеты, благодаря чему по окончании сводки будут иметься конкретные данные для оценки полученных итогов. Конечно, как мы об этом уже упоминали, эта оценка с точки зрения надежности готовых опубликованных цифр производится также на основе обзора всей постановки данной операции — в отношении организационном, местных условий обследуемой среды и т.д., а также при помощи сопоставления с данными других однородных обследований и вообще с имеющимися в распоряжении исследователя материалами, характеризующими положение вещей в области, к которой относится рассматриваемый цифровой материал.

Теперь мы продолжим рассмотрение основных вопросов, возникающих при табличной сводке сырого статистического материала, к которым мы подошли в конце прошлой лекции.

Статистические таблицы.

В предыдущей лекции мы установили общее представление о статистической таблице.

По внешнему виду каждая таблица состоит из прямых линий, пересекающихся под прямыми углами и образующих вертикальные и горизонтальные графы, в заголовке коих дается обозначение их содержания; таблица заканчивается обычно общими итогами.

Конечно, такое формальное определение таблицы мало говорит уму и сердцу. Это определение надо заполнить материальным содержанием.

Табличное оформление статистического материала — основной прием для того, чтобы «раскрыть цифрам рот», заставить их «говорить». Это уже было отмечено нами в прошлой лекции. Однако, по замечанию известного немецкого статистика Рюмелина, цифры говорят что-либо лишь сведущему человеку. Это значит, что таблицу надо уметь спроектировать, уметь построить. Неудачно задуманная таблица, послужившая для группировки материала, может лишить этот материал как практического, так и научного значения. При этом в каждом конкретном случае возникают свои особые задачи и особенности материала, определяющие содержание таблицы. Поэтому статистическая теория не может дать общих правил, определяющих для каждого данного случая лучший прием построения таблицы и группировки материала. Такое умение приобретается, главным образом, в процессе практической работы над статистическими материалами. В нашем изложении мы также будем, по возможности, ближе держаться к практическим случаям построения таблиц.

Мы видели уже (в первой лекции по статистике («К.У.» № 2, стр. 132—134 и 136—139), что статистика всегда имеет дело с множеством, массой, группой — фактов, явлений, предметов. Статистические правильности и закономерности могут быть установлены лишь на основе больших чисел, представляющих собою результат массовых наблюдений; на мелких частях этой массы и на отдельных случаях такие правильности установлены быть не могут. К этому, в сущности, и сводится так наз. закон больших чисел. Происхождение каждой отдельной единицы наблюдения случайно. Поэтому необходимо об'единять эти единицы в статистические совокупности. А совокупности, при условии включения в свой состав достаточного числа наблюденных случаев, открывают пути к выявлению тех правильностей, которые проявляются в статистических данных, характеризующих обследуемые явления.

Это об'единение единиц статистического наблюдения в совокупности и достигается посредством табличных построений.

Читатель знает, что всякая таблица, помимо пересекающихся вертикальных и горизонтальных линий (при чем, как это видно и на примере приведенных в нашем курсе таблиц, горизонтальные линии могут быть «мысленными», «воображаемыми», т.-е. фактически не проводиться) и помимо цифр, заполняющих образуемые этими линиями клеточки, — имеет также заголовки над своими графами (графой называется промежуток между двумя продольными или поперечными чертами).

Заголовки граф устанавливают содержание таблиц и очерчивают границы совокупностей, которые лежат в основании данной таблицы. Естественно, поэтому, что заголовки эти должны быть выработаны до заполнения табличной сетки цифрами.

Кроме заголовков для каждой графы, таблица снабжается общим, так сказать генеральным заголовком (напр, таблица № 1 в настоящей лекции озаглавлена «население Ленинграда».

Все эти заголовки необходимо формулировать точно и ясно, так как ими определяется материальное содержание таблиц, и какие-либо промахи и недоразумения в этом отношении могут обесценить всю работу по сводке. Точно также при опубликовании уже законченных таблиц большое значение имеет тщательная общепонятная редакция их заголовков и всех словесных к ним пояснений, — особенно потому, что статистическими материалами пользуются и не-статистики. Об этом простом соображении иной раз, к сожалению, забывают.

Можно сказать, что до возникновения и развития статистики цифровое описание явлений, как метод их анализа, заменялось описанием словесным.

Но современные статистические издания (мы имеем в виду, главным образом, издания официальные, так как только государству или крупным общественным организациям, вообще говоря, по силам производство крупных статистических операций широкого общественного значения) грешат обычно противоположным недостатком: в них отсутствуют какие-либо вводные, облегчающие пользование и усвоение цифровых материалов, текстовые раз'яснения и обобщения.

В этой лекции уже упоминалось о необходимых комментариях к публикуемым таблицам, когда мы говорим о своего род «исповеди» составителей статистических сборников, кающихся в недочетах, присущих материалу, вошедшему в данное издание.

Этого, однако, недостаточно. Ведь та не любовь, которая часто встречается в широких кругах читателей к «сухим» статистическим сборникам (а эта нелюбовь имеется — тут скрывать нечего), основана в значительной мере на нежелании пускаться в странствие по цифровым дебрям, какими представляются рядовому читателю, не имеющему надлежащего представления о статистике, таблицы, заполняющие сборник.

Один известный русский статистик (Кауфман) полагает даже, что так это и должно быть, и что если читателю попадается в руки статистический сборник, сплошь разграфленнный толстыми и тонкими линиями и испещренный цифрами — то он, читатель, будет прав, если, раскрыв сборник, он как можно скорее его закроет и отложит в сторону; статистические сборники существуют не для того, чтобы их читать, а только для наведения справок.

Нам представляется, что в этом рассуждении взята не надлежащая отправная точка. Вовсе не требуется, чтобы статистические сборники были «сплошь испещрены цифрами». В таком виде они, конечно, будут использованы лишь лицами, имеющими известную статистическую подготовку.

Но отнюдь не неизбежно, чтобы статистический сборник, справочник или иное статистическое издание состояли только из цифр.

Как в предисловии к таблицам, так и в сопровождающем таблицы тексте — если таковой дается в сборнике — надлежит вкратце излагать значение и содержание таблиц и важнейшие выводы из них, проводить основные сопоставления, сравнения. В подобных предисловиях иногда помещают небольшие таблички (а также диаграммы), концентрирующие в себе основное содержание сборника.

Для тех, кто ограничивается просмотром текстовой части статистического сборника и не рассматривает всех напечатанных таблиц — эти таблички и вообще «литературная» часть заменяют ознакомление со всем статистическим материалом. А тех немногих, которые имеют ввиду приступить к изучению самих таблиц, и иногда это действительно осуществляют, а также пользующихся статистическими изданиями для справочных целей — текстовое введение именно вводит в стройное здание табличных построений.

Комментирующий таблицы текст не должен быть при этом слишком «специальным», т.-е. доступным для усвоения лишь знатоком предмета, так как тогда отпало бы его популяризирующее значение, только-что нами отмеченное. Этот текст не должен также непременно быть изложенным так наз. «официальным» — другими словами, канцелярским — слогом. Чем ближе к разговорно-литературной речи, тем лучше.

Примером удачного комбинирования текста и таблиц в статистическом сборнике может служить только-что вышедшая в свет книга «Партия в цифровом освещении. Материалы по статистике личного состава партии», выпущенная Статотделом ЦК РКП (б).

В предисловии к названному сборнику хорошо обосновано значение издания подобного характера, т -е. сочетающего в себе таблицы с пояснительным к ним текстом. Периодически выпускаемые Стат. Отд. ЦК РКП сборники «РКП в цифрах» — читаем мы в предисловии — содержат исключительно цифровой материал без пояснительного текста и носят характер справочников. Однако, использование богатого материала партийной статистики только для узко-справочных целей было бы далеко не полным. Представляется полная возможность осветить светом цифр нашу партию, ее личный состав, основные, происходящие в нем процессы, достижения в деле улучшения состава, проникновения партии в массы и пр.

Статистическое подлежащее и статистическое сказуемое.

Обратимся, однако, к дальнейшему рассмотрению таблиц, как таковых.

Наше замечание о соотношении цифр и слов в отношении к статистическим таблицам мы привели в связи с рассмотрением вопроса о заголовках статистических таблиц.

Как вертикальные, так и горизонтальные графы имеют, как мы видели, свои заголовки.

По аналогии (сопоставлению) с предложением, которое мы изучаем в грамматике, статистическую таблицу называют — статистическим предложением; статистическая таблица может иметь свое статистическое подлежащее и статистическое сказуемое, находящее выражение в соответственных заголовках таблицы.

Заголовки горизонтальных граф, или строк, как иногда называют эти графы — (впрочем, строками называют иной раз и вертикальные графы), расположенные в таблице сбоку, в виде вертикального столбца, — называют статистическим подлежащим. Эти боковые заголовки, каждому из которых соответствует в таблице горизонтальная строка, отвечают на вопрос — что или кто характеризуется цифрами, расположенными в данной строке; они (заголовки) говорят о том, к каким совокупностям или к каким составным частям сложной совокупности относятся цифры, помещенные в той или иной горизонтальной строке.

Заголовки вертикальных граф, расположенные сверху горизонтально, один рядом с другим, отвечают на вопрос, какими признаками характеризуются те совокупности (или составные части сложной совокупности), которые поименованы в боковых заголовках. Верхние заголовки носят название статистического сказуемого.

Расположение заголовков, выражающих подлежащее таблицы — сбоку, а сказуемое — сверху является общепринятым, но не обязательным; иногда подлежащее и сказуемое меняются местами, и тогда подлежащее будет соответствовать вертикальным графам, а сказуемое — горизонтальным.

Связь между отдельными ступенями статистической работы.

При выработке заголовков таблицы, т.-е. при определении того содержания таблицы, количественный учет которого выражается в цифрах, имеющих войти в данную таблицу — выявляется тесная связь, существующая между отдельными ступенями статистической работы.

Программа статистического наблюдения (см. лекцию 3-ю, «К. У.» № 4, стр. 126 и далее) устанавливает ту массу, которая подвергается наблюдению; входящие в состав наблюдаемой массы единицы подсчитываются, при чем у однородных экземпляров отмечается наличие или отсутствие определенного признака (если признак этот качественный), или же значения признака, изменяющегося от одного экземпляра к другому, подвергаются измерению (если признак — количественный).

Отдельные экземпляры эти сами по себе не представляют интереса для статистического изучения и важны только лишь как материал для составления совокупностей, которые и изучаются в статистике.

Об'единение единиц наблюдения в совокупности и достигается при статистической сводке посредством табличных построений. Ясно, что содержание таблиц предопределяется в значительной мере программой наблюдения. Мы не можем составить по данным городской переписи 1923 г. таблицу распределения населения Ленинграда по грамотности, раз вопрос о грамотности не был включен в программу переписи. Обычно, однако, получается не недостаток сырого статистического материала с точки зрения широты охвата им наблюдаемого явления, а скорее перепроизводства такового; данные, полученные в результате наблюдения, разрабатываются далеко не полно. Причиной тому часто является невыполнение при выработке программы наблюдения т. н. первого правила Кетле — ставить только такие вопросы, которые безусловно необходимы; лучше меньше да лучше (3-я лекция, «К. У.» № 4, стр. 129—130). В итоге же — излишне затраченная работа при проведении наблюдения.

Поэтому особенно важно увязывать программу статистического наблюдения какого-либо явления с программой его сводки и далее — научной разработки, поскольку исходным пунктом научной разработки служит подсчет результатов наблюдения, табличная сводка. Построенные на основе материалов наблюдения таблицы, подготовляют и в известной степени дают направление последующей научной разработке.

Вместе с тем, без последующей научной разработки, одна лишь табелляция (расположение по таблицам) материалов статистического наблюдения не даст нам законченного статистического исследования.

Учитывая программу научной разработки, и следует вырабатывать таблицы для сводки данных наблюдений. Конечно, при проектировании таблиц, приходится принимать во внимание не только интересы дальнейшего научного исследования. Первостепенную роль играет здесь также практическое значение сводимых данных, те требования и запросы, которые выдвигаются непосредственно жизнью.

Уменье статистика и должно найти себе выражение в таком выборе табличных построений, которое, исходя из характера материала, удовлетворяло бы как целям научной разработки, так и практическим потребностям в статистических данных. Требуется большой навык и знания в этой работе, чтобы опубликованные в результате сводки таблицы действительно сослужили свою службу обществу и не обогатили бы одним лишним изданием обширное «кладбище» печатных статистических материалов, лежащих втуне и никем не используемых.

Вырабатываемые для целей сводки таблицы могут существенно отличаться друг от друга не только в отношении их содержания, но и с точки зрения построения их; об этом мы упоминали в конце нашей 5-й лекции («К. У.» № 6, стр. 136). В зависимости от большей или меньшей сложности, различают отдельные виды статистических таблиц: таблицы простые, групповые и комбинационные.

В основу деления таблиц может быть положено деление совокупностей, лежащих в основе этих таблиц.

Когда мы в первой лекции говорили о совокупностях, то установили три вида их: совокупности социальные (например, совокупности жителей — страны, губернии, уезда), совокупности естественные (например, лес — совокупность деревьев) и, наконец, совокупности статистические в собственном значении слова, искусственно образуемые для целей статистического исследования (например, группы квартир с 1 жителем; с 2 жителями; с 3 жителями; с 4—5 жителями и т. д.). Первые два вида совокупностей (социальные и естественные) могут быть, в противопоставлении с совокупностями искусственными, об'единены в одну группу—группу совокупностей естественных в широком значении этого слова, т.-е. конкретно существующих, как социальное явление, или явление природы.

Так вот, если различать статистические таблицы по степени расчлененности подлежащего (т.-е. бокового заголовка), то мы получим два основных вида таблиц.

Это будут, во-первых, таблицы, где подлежащее представляет собою перечень естественных (в широком значении слова) групп, на которые распадается обследованная масса; такие таблицы называются простыми или перечневыми.

Вторым же видом таблиц явятся таблицы, где подлежащее состоит из групп, образованных искусственно, т. е. путем разбивки какой-либо естественной в широком смысле слова совокупности на ряд совокупностей искусственных, возникающих в результате статистического отбора отдельных единиц с тем или иным определенным признаком. Здесь мы имеем таблицы групповые и комбинационные.

Приведенное только-что деление таблиц на два вида (простые таблицы — с одной стороны и групповые и комбинационные — с другой) не имеет — следует отметить — безусловного значения; не всегда можно провести точную границу между отдельными типами таблиц; одну и ту же таблицу оказывается иногда возможным «подводить» как под одно, так и под другое наименование, в зависимости от точки зрения исследователя.

Это обстоятельство, конечно, не умаляет значения данной классификации, поскольку вообще в основе всякой классификации лежит известная «условность», «относительность».

Изложенное различие таблиц по их подлежащему (боковому заголовку) сводится к различию в основании и характере группировки тех частей изучаемой массы, к которым приурочивается весь подсчет поименованных в сказуемом (верхнем заголовке) признаков. Отсюда ясно значение правильного понимания отличия одного вида таблиц от другого — как для надлежащего пользования ими, так и для самостоятельного построения их.

Для лучшего усвоения нашей классификации, мы поясним ее на нескольких примерах.

Мы видели, что в основе расчленения материала в простых (перечневых) таблицах лежит деление его по признакам, по основаниям, даваемым самым существом или природой явления; мы имеем, следовательно, дело с «натуральной», «естественной» группировкой единиц, составляющих данную массу.

Такими группировками могут быть как территориальные (по единицам пространства) и хронологические (по единицам времени), так и иные, соответствующие конкретной обстановке тех или иных явлений или масс.

Остановимся сперва на разбивке в простых таблицах статистического материала по единицам пространства и времени.

По признаку времени расположен материал в перечневой таблице «население Ленинграда», данной в 5-й лекции («К. У.» № 6, стр. 136), а также в таблице № 1 того же заглавия в настоящей лекции.

Приведем еще пример хронологической простой таблицы (№ 2)

Табл. № 2.
Прибытие топлива в Ленинград.
(В тысячах пудах).
Прибыло. ГОДЫ.
Всего В том числе угля.
1914 183,222,0 109,400,0
1915 231,318,0 106,900,0
1916 240,390,3 89,781,3
1917 185,565,8 49,607,2
1918 61,707,2 6,446,2
1919 39,317,4 1,463,7
1920 57,042,4 3,643,6
1921 56,867,8 6,335,4
1921-1922 76,726,7 21,427,2
1922-1923 93,456,5 20,512,9
1923-1924 107,187,9 40,141,7

И еще одну таблицу той же категории (№ 3).

Табл. № 3.
Число переговоров (соединений) по ленинградской телефонной сети за февраль—апрель 1925 года.
ДНИ НЕДЕЛИ. Число
дней.
Число
переговоров.
В среднем
за день.
Воскресные и праздничные дни 17 2,064,443 121,761
Понедельник 12 2,571,396 214,283
Вторник 13 2,748,385 211,414
Среда. 12 2,556,027 213,002
Четверг 12 2,536,557 211,380
Пятница 12 2,543,372 211,948
Суббота 11 2,330,978 211,907
Итого. 89 17,356,658 195,019

Ниже мы помещаем таблицу (№ 4), представляющую расчленение стат. материала в простой таблице по территориальному признаку.

Табл. № 4.
Порайонное распределение членов и кандидатов РКП (б) на 1-е января 1925 года.
НАИМЕНОВАНИЕ ОРГАНИЗАЦИЙ. Число коммунистов. В том числе.
Членов РКП. Кандидатов.
В абсол. числах. В %% к итогу. В абсол. числах. В %%. В абсол. числах. В %%.
I. РСФСР 565.050 76,2 306.548 54,3 258.502 45,7
в том числе:
а) Центральные губ. 266.112 47,1 140.037 56,0 117.085 44,0
б) Сев. Зап. Обл. 70.979 14,2 42.978 53,7 37.001 46,3
в) Уралобласть 47.940 8,5 25.425 53,0 22.515 47,0
г) Сев.-Кавк. край. 43.546 7,7 22.716 52,2 20.830 47,8
д) Сибирь. 50.708 9,0 28.967 57,1 21.741 42,9
е) Дальне-вост. об'единение 15.978 2,8 8.047 50,6 7.931 49,6
ж) Кавказская авт. область. 27.372 4,8 13.225 48,3 14.147 51,7
з) Проч. авт. респ. и области 33.405 5,9 16.153 48,4 17.252 51,6
II. Украинская ССР 101.852 13,7 43.325 52,4 48.527 47,6
III. ЗСФСР 41.358 5,6 24.201 58,5 17.157 41,5
IV. Узбекская ССР. 16.570 2,3 8.851 50,4 8.219 49,6
V. Белорусская ССР 11.267 1,5 6.646 59,0 4.621 41,0
VI. Туркменская ССР. 5.020 0,7 2.410 48,0 2.610 52,2
Всего 741.117 100,0 401.481 54,2 339,736 45,8

Кроме группировки по признакам времени и пространства, материал в простых таблицах может быть сгруппирован и по иным признакам.

Вот, например, простая таблица (№5), где разбивка материала (посевная площадь) произведена по признаку культур.

Табл. № 5.
Посевная площадь крестьянских хозяйств за 1916, 1920 и 1924 гг.
(В десятинах).
НАЗВАНИЕ КУЛЬТУР. Годы
1916 1920 1924
Озимая 95.651 81.253 106.945
Овес 97.648 50.597 72.391
Ячмень 33.874 25.683 38.414
Картофель 31.384 11,925 27.216
Лен. 12.541 3.154 10.637
Травы. 28.884 16.305 27.367
Прочие культуры 8.382 5.218 12.185
Итого 298.364 194.135 295.145

В видах экономии места, мы не будем умножать примеров простых таблиц, где материал расчленен по иным естественным признакам, чем время или пространство; кстати сказать, эти две последние группировки являются для простых таблиц наиболее общими и обычными.

Что касается других признаков, которые кладутся в основу построения простых таблиц, то они весьма разнообразны.

Так, например, в статистике сельского хозяйства, помимо приведенного примера разбивки посевной площади по культурам, данные разрабатываются и публикуются и по иным признакам; так, напр., о скотоводстве — по составу скота (напр., лошади, коровы и т. д.), о землепользовании — по составу земельных угодий (напр., усадьба, пашня, сенокос, выгон и т. д.), по распределению земли между отдельными категориями землепользователей (напр., — сельские общины, товарищества, коммуны, артели, отруба, хутора, совхозы, зем. органы, учреждения) и пр.

Данные по статистике преступности разбиваются по родам и видам преступлений. Напр., по нашему Уголовному Кодексу различаются — преступления контр-революционные; против порядка управления; против личности; имущественные; воинские; должностные; церковные; нарушение правил народного здравия и общественной безопасности. Каждый из этих родов преступности можно разделить на виды преступлений; так, напр., должностные преступления делятся на — растраты, превышение власти и т. д.

В промышленной статистике данные разрабатываются часто по предприятиям или по категориям и отраслям производства (см., напр., таблицу в нашей 1-й лекции, "К. У." № 2, стр. 142).

В статистике внешней торговли материалы о ввозе и вывозе группируются по родам и видам товаров, или по странам назначения или вывоза, или по таможням.

Этими примерами мы закончим рассмотрение таблиц первого вида — простых (или перечневых), и перейдем к таблицам второго вида — групповым и комбинационным.

Таблицы групповые и комбинационные об'единяются в один вид общностью искуственной группировки материалов. В этом их отличие от простых таблиц, отличие, основанное на существе кладущихся в основу группировки материала признаков. Различие же групповых и комбинационных таблиц между собой — не в существе признаков, а только в числе этих признаков.

Расчленение материала в групповых таблицах производится путем разбивки совокупности на качественно различные группы.

Если каждую из таких групп разделить на подгруппы по какому-либо другому признаку, то получается комбинационная таблица.

В прошлой (5-й) лекции таблица «капиталы в крестьянском хозяйстве Ленинградской губ.» («К. У.» № 6, стр. 138) является таблицей групповой, а таблица «квартиры по населенности» (там же, стр. 137) — комбинационной.

Вот еще пример групповой таблицы:

Табл. № 6.
Распределение крестьянских хозяйств Ленинградской губернии по обеспеченности коровами.
Группировка
хозяйств по
обеспеченности
коровами.
%% хозяйств в группе.
1920 г. 1924 г.
Без коров 11,08 8,09
С 1 коровой 50,58 51,43
"" 2 "" 29,78 33,32
"" 3 "" 6,46 6,08
"" 4 "" 1,64 0,85
"" 5 "" 0,46 0,23
Итого 100,00 100,00

Эта групповая таблица (№ 6) обратится в комбинационную, если мы введем дальнейшее расчленение подлежащего (напр., по размеру посева). Тогда боковой заголовок примет примерно такой вид:

Группировка хозяйств по обеспеченности коровами и по посевной площади.
Без коров.
      Без посева и с посевом до   0,1 десятины
  С посевом от 0,11 1,0 десятины
  ""    "" "" 1,01 2,0 ""
  ""    "" "" 2,01 4,0 ""
  ""    "" "" 4,01 6,0 ""
  ""    "" "" 6,01 дес. и выше.
С 1 коровой.
      Без посева и с посевом до   0,1 десятины
  С посевом от 0,11 1,0 десятины
  ""    "" "" 1,01 2,0 ""
  ""    "" "" 2,01 4,0 ""
  ""    "" "" 4,01 6,0 ""
  ""    "" "" 6,01 дес. и выше.
С 2 коровами.
      Без посева и с посевом до   0,1 десятины
  С посевом от 0,11 1,0 десятины
  ""    "" "" 1,01 2,0 ""
  ""    "" "" 2,01 4,0 ""
  ""    "" "" 4,01 6,0 ""
  ""    "" "" 6,01 дес. и выше.
С 3 коровами.
      Без посева и с посевом до   0,1 десятины
  С посевом от 0,11 1,0 десятины
  ""    "" "" 1,01 2,0 ""
  ""    "" "" 2,01 4,0 ""
  ""    "" "" 4,01 6,0 ""
  ""    "" "" 6,01 дес. и выше.
С 4 коровами.
      Без посева и с посевом до   0,1 десятины
  С посевом от 0,11 1,0 десятины
  ""    "" "" 1,01 2,0 ""
  ""    "" "" 2,01 4,0 ""
  ""    "" "" 4,01 6,0 ""
  ""    "" "" 6,01 дес. и выше.
С 5 коровами.
|
|
|
Итого {
|
|
|
    Без посева и с посевом до   0,1 десятины
С посевом от 0,11 1,0 десятины
""    "" "" 1,01 2,0 ""
""    "" "" 2,01 4,0 ""
""    "" "" 4,01 6,0 ""
""    "" "" 6,01 дес. и выше.

Групповые и комбинационные таблицы дают возможность более детального изучения материала, чем простые таблицы, и открывают путь к установлению статистических правильностей и зависимостей. Комбинационные таблицы могут, понятно, расчленять материал и более, чем по 2 признакам. Однако, далее 4 признаков обычно не идут, так как это может привести к слишком мелким группировкам, не позволяющим сделать обоснованные выводы (закон больших чисел!). К тому же, слишком большие таблицы вообще недостаточно наглядны.

На этом мы остановимся в рассмотрении вопросов статистической сводки — до следующей лекции.

ВОПРОСНИК.

  1. Как производится и для каких целей статистическая сводка?

  2. Что вы знаете о вторичной критической проверке статистического материала? Когда и как таковая проводится?

  3. К какому времени приурочивается первичная проверка материала?

  4. Может ли вторичная проверка заменить первичную (и обратно)? Каково взаимоотношение этих двух форм контроля материалов, собираемых при стат. наблюдении?

  5. Почему важно точное установление оставшихся неустраненными и неустранимых недочетов стат. материалов? Какое сравнение приведено в лекции по этому поводу из области промышленнопроизводственной?

  6. Что видно из таблицы № 1 («Население Ленинграда») в отношении изменения численности ленинградского населения?

  7. В чем состоит значение правильного построения стат. таблицы? Что говорит об этом немецкий статистик Рюмелин?

  8. Для какой цели образуют статистические совокупности? Какие еще виды совокупностей вам известны?

  9. Каково значение заголовков стат. таблиц?

  10. Почему необходим текстовый комментарий к публикуемым стат. таблицам?

  11. Что такое статистическое подлежащее?

  12. Как мы определили статистическое сказуемое?

  13. В чем состоит материальная связь между стат. наблюдением и стат. сводкой?

  14. В чем заключается взаимодействие программ стат. сводки и научной разработки?

  15. Как можно подразделить стат. таблицы, исходя при этом из расчленения на составные части стат. подлежащего?

  16. По каким признакам можно разбивать стат. материал в простых (перечневых) таблицах?

  17. Какие приведены примеры в прошлой и настоящей лекции простых таблиц, в которых материал разбит по единицам времени?

  18. Как колебались цифры прибытия топлива в Ленинград за 1914—1924 г. г. (см. табл. № 2)?

  19. Какие выводы можно сделать из табл. № 3 о работе ленинградской телефонной сети?

  20. Изложите содержание табл. № 4 о порайонном распределении членов и кандидатов РКП (б).

  21. По какому признаку расчленено подлежащее в табл. № 5 (посевная площадь крестьянских хозяйств Ленинградской губ.)?

  22. Какие изменения произошли в размере и составе этой посевной площади за время с 1916 по 1920 и с 1920 по 1924 год?

  23. Какие еще примеры разбивки материала в простых таблицах приведены нами в лекции?

  24. Что об'единяет групповые и комбинационные таблицы в один вид? А в чем состоит их различие?

  25. Какие примеры групповой и комбинационной таблицы приведены были в прошлой и настоящей лекции?

  26. Какие выводы можно сделать из табл. № 6 — в отношении изменения обеспеченности коровами крестьянских хозяйств Ленинградской губ., за время с 1920 по 1924 г.?

  27. Что мы говорили по вопросу о степени расчленения стат. материала в нашей первой и в настоящей лекции?

  28. Какому стат. органу следует, по вашему мнению, поручать производство стат. сводки — тому ли, который проводил стат. наблюдение, или иному, централизующему руководство этой работой?

ЛИТЕРАТУРА.

В прошлой (5 лекции) были уже указаны соответственные места в нескольких статистических руководствах для дополнительной к лекциям проработки вопросов статистической сводки.

Для второочередного чтения, требующего известной подготовки, можно еще указать книги: К. Г. Воблый: «Статистика» (по 6-му изданию 1924 года. ГИЗ Украины, Отд. II, гл. XII, стр. 149—159) и далее — П. А. Вихляев: «Очерки теоретической статистики» (изд. Центр. Стат. Управления, Москва, 1924, стр. 57—77).

Элементарное, конспективное изложение можно найти у А. Ф. Фортунатова в его брошюре «О статистике», вышедшей в нескольких изданиях; по 3-му изд. (ЦСУ, Москва, 1921), см. стр. 17—20.

Из упомянутых пособий книга Воблого стоит 1 р. 40 к., стоимость двух последних книг (Вихляев и Фортунатов) — на них не указана.

Приведенная литература дает лишь фактический материал, вне марксистского освещения.


1 Читателю следует сопоставить эту таблицу (№ 1) — с таблицей «население Ленинграда», данной нами в прошлой (5-й лекции) «К. У.» № 6, и уяснить себе, в чем состоит их различие (помимо большего числа лет, по которым приводятся цифры населения).


Hosted by uCoz