Статистические графики

Статистические таблицы

Статистическая таблица представляет форму рационального, наглядного изложения данных и результатов статистического исследования явлений и процессов. Таблицы позволяют рассматривать статистические данные или результаты совместно, достаточно полно и точно охватывая сложную природу явлений.

Статистическая таблица состоит из названия таблицы, подлежащего, сказуемого и значений статистических показателей (например, числовые данные).

Из названия таблицы[1] становится известно:

а) какой круг вопросов излагает и иллюстрирует таблица;

б) каковы географические границы совокупности объектов, представленные таблицей;

в) каковы периоды или моменты времени соответствуют данным таблицы;

г) каковы единицы измерения (если они одинаковы для всех табличных клеток). Если единицы измерения неодинаковы, то в верхних или боковых заголовках обязательно следует указывать, в каких единицах приводятся статистические данные (тонн, штук, рублей и пр.).

Подлежащее таблицы – это перечень наименований единиц совокупности, т.е. объект изучения. Сказуемое таблицы – это наименования статистических показателей, характеризующих подлежащее. Подлежащее располагается обычно слева в виде названий строк, сказуемое – сверху в виде названий граф.

Основой статистической таблицы является ее макет – графы (столбцы) и строки, имеющие свои заголовки, наименования. Для полной таблицы следует внести конкретные данные в пересечение каждой строки и графы.

По построению подлежащего таблицы могут быть простыми, групповыми, комбинационными.

Простой называется такая статистическая таблица, в подлежащем которой нет группировок. Простые таблицы бывают перечневые (подлежащее – перечень единиц, составляющих объект изучения), территориальные (дается перечень территорий, стран, областей и пр.), хронологические (в подлежащем приводятся периоды времени или даты).

Названия строк
(подлежащее)
Заголовки граф (сказуемое)
Перечень единиц совокупности

Рисунок 3.1. Макет статистической таблицы.

Групповыми называются таблицы, в подлежащем которых изучаемый объект разделен на группы по какому-либо признаку.

Комбинационной таблицей называется такая, когда в подлежащем дается группировка совокупности по нескольким признакам, взятым в комбинации.

Таблицы различаются и по разработке сказуемого: простая и сложная. Простая разработка сказуемого предусматривает параллельное расположение показателей, а сложная разработка – комбинированное.

Так, например, при простой разработке сказуемого сначала могут быть приведены графы, содержащие данные о численности населения с соответствующим уровнем образования (начальное, среднее и т.д.). При сложной разработке сказуемого после графы численности населения с каким-либо конкретным уровнем образования приводятся в отдельных графах данные о соответствующей численности мужчин и женщин.

Практикой выработан ряд требований к составлению и оформлению таблиц.

1. В таблице желательно давать нумерацию граф. Это облегчает пользование таблицей, дает возможность лучше ориентироваться, показывает способ расчета цифр в графах. Первые графы, содержащие подлежащее, обозначаются заглавными буквами алфавита; графы, содержащие сказуемое, нумеруются арабскими цифрами. Заглавия строк подлежащего и граф сказуемого должны быть сформулированы кратко, точно и ясно. Все слова в заголовках подлежащего и сказуемого таблицы записываются по возможности полностью. Заголовки граф следует сформулировать так, чтобы были ясны смысл данной величины и порядок ее расчета.

2. Приводимые в подлежащем и сказуемом признаки должны быть расположены в логическом порядке с учетом необходимости рассматривать их совместно. Обычный принцип размещения – от частного к общему, т.е. сначала показывают слагаемые, а в конце подводят итоги (если это необходимо). Когда приводятся не все слагаемые, а лишь наиболее важные из них, применяется противоположный принцип – сначала показывают общие итоги, а затем выделяют наиболее важные части («Итого», «Всего», «В том числе», «Из них»).

3. Таблица по возможности должна быть краткой, но может сопровождаться примечаниями, в которых указываются источники данных, более подробно раскрывается содержание показателей, даются другие пояснения, а также оговорки (если таблица содержит сведения, полученные в результате вычислений).

4. При оформлении таблиц обычно применяются условные обозначения:

знак тире «–», когда явление отсутствует;

- – если явление не имеет осмысленного содержания;

многоточие «...», когда отсутствуют сведения о его размере (или делается запись «Нет сведений»).

Загрузка...

5. Если сведения имеются, но числовое значение меньше принятой в таблице точности, оно выражается дробным числом (0,0). Округленные числа приводятся в таблице с одинаковой степенью точности (до 0,1; до 0,01 и т.п.). Проценты роста, то во многих случаях целесообразно (от 300 % и более) заменять отношениями в разах. Например, писать не “1000 %”, а “в 10,0 раз”.

Графиками в статистике называются условные изображения числовых величин и их соотношений в виде различных геометрических образов – точек, линий, плоских фигур и т.п. Графические образы придают наглядность исходным данным, помогают представить закономерности, которые часто трудно заметить в сложных статистических таблицах и больших числовых массивах. История статистики дает множество примеров использования графических образов для наглядного представления явлений. К настоящему времени основные графические процедуры реализованы в системах обработки электронных таблиц (типа MS Excel) и статистического анализа данных на ПЭВМ (STATISTICA, SPSS, STATGRAPH, SAS и т.д.). Именно так были получены все представленные далее графические иллюстрации.

Многообразие видов статистических графиков объясняется разными целями, способами построения, глубиной отображения явлений и процессов. Поэтому важно не только знать виды графиков, но и владеть методикой их построения. Каждый график состоит из графического образа и вспомогательных элементов.

Графический образ – это совокупность точек, линий и фигур, с помощью которых изображаются статистические данные. Вспомогательными элементами графика являются:

1) поле графика – это пространство, в котором размещаются графические образы. Поле характеризуется его форматом, т.е. размером и пропорциями;

2) пространственные ориентиры, определяющие расположение графических образов. Пространственные ориентиры задаются системой координатных сеток или контурных линий, которые делят поле графика на части. В статистических графиках используются как прямоугольные, так и полярные системы координат;

3) при необходимости сопоставить графическое отображение объекта и его реальные размеры указываются масштабные ориентиры. Масштабные ориентиры задаются системой масштабных шкал или масштабными знаками. Масштабные шкалы сообщаются для каждой координатной оси графика. Масштабные знаки используются преимущественно для статистических карт;

4) экспликация графика, состоящая из объяснения предмета, изображаемого графиком (его названия) и смыслового значения каждого знака, применяемого на графике. Название графика должно кратко и точно раскрывать его содержание. Пояснительные тексты могут располагаться в пределах графического образа или рядом с ним (ярлыки), а также выноситься за его пределы (ключ).

Статистические графики можно классифицировать по назначению (содержанию), способу построения и характеру графического образа.

По назначению можно выделить графики сравнения в пространстве, графики различных относительных величин (структуры, динамики и т.п.), графики вариационных рядов, графики размещения по территории, графики взаимосвязанных показателей. Возможны разные комбинации, например отображение вариации во времени или изменение взаимосвязанных показателей.

По способу построения графических образов можно выделить:

диаграммы, представляющие графическое изображение статистических данных, наглядно показывающее соотношение между сравниваемыми величинами;

картограммы, представляющие контурную географическую карту, на которой штриховкой или иным способом показана сравнительная интенсивность изучаемого явления в пределах отдельной единицы территориального деления. Разновидностью картограммы является картодиаграмма, когда сравнительная интенсивность характеризуется диаграммной фигурой (изображением леса, пашни, одежды и т.п.) и ее размерами.

В настоящее время для графического отображения чаще применяют диаграммы. Это могут быть диаграммы точечные, линейные, плоскостные и объемные. Видами плоскостного графика являются столбиковые, квадратные, круговые, секторные, временные, фигурные диаграммы.

Рисунок 3.2. Производство электроэнергии в отдельных странах
в 1996 г. (млрд кВтч). Столбиковая диаграмма.

Столбиковая диаграмма используется для сравнения одноименных показателей, характеризующих различные объекты или территории. Значения сравниваемых показателей изображаются при этом в виде прямоугольников, имеющих одинаковую ширину и расположенных на общей горизонтальной базовой линии. Если базовая линия вертикальная, то говорят о полосовой или ленточной диаграмме. Высота (или длина) каждого столбика в определенном масштабе соответствует величине изображаемого показателя. Столбики могут располагаться вплотную либо на одинаковом расстоянии. Ленточная диаграмма особенно удобна, если отдельные объекты сравнения характеризуются противоположными по знак показателями (например, показателями прироста). Пример столбиковой диаграммы представлен на рисунке 3.2, ленточной диаграммы – на рисунке 3.3.

Рисунок 3.3. Производство электроэнергии в отдельных странах
в 1996 г. (млрд. кВтч). Полосовая диаграмма.

Иногда сравниваемые объекты характеризуются резко разнящимися значениями показателей. В этих случаях используют особые виды плоскостных диаграмм: квадратные или круговые. Их построение основано на том, что величины изображаемых показателей должны быть пропорциональны площадям квадратов или кругов, а корни квадратные из сравниваемых величин пропорциональны линейным размерам этих фигур. Например, по данным переписи населения на 9 октября 2002 г. численность постоянного населения Российской Федерации составляла 145,182 млн. чел.; городов Москва, Санкт-Петербург, Новосибирск, соответственно, 10375,8 тыс. чел., 4669,4 тыс. чел. и 1425,6 тыс. чел. Представить эти данные с помощью столбиковой диаграммы практически невозможно, так как высота одного столбика (РФ) должна была бы в 14 раз превышать высоту другого при сравнении с Москвой, в 31 раз при сравнении с Санкт-Петербургом и в 102 раза при сравнении с Новосибирском. Отношения квадратных корней из численности населения (млн. чел.) равны, соответственно, 12,049:3,218:2,161:1,194. Принимая численность населения Новосибирска за единицу, получаем отношения сторон квадратов — 10,1:2,5:1,8:1. Квадраты с приблизительно таким соотношением сторон показаны на рисунке 3.4.

Рисунок 3.4. Численность постоянного населения Российской Федерации и крупнейших городов на 9.10.2002 г

Для отображения структуры изучаемого явления применяют секторные диаграммы, у которых главным геометрическим параметром служит величина угла между радиусами секторов, сумма всех углов (360°), приравнивается к 100%. Другой формой отображения структуры или состава явления служит полосовая диаграмма с подразделенными полосами.

Выразительность секторных диаграмм обеспечивается при делении совокупностей на небольшое число частей – не более 10. Секторная диаграмма выглядит достаточно убедительно лишь при существенных различиях сравниваемых структур. Другой формой структурных статистических диаграмм являются полосовые диаграммы удельных весов (рисунок 3.6).

Например, в результате анализа выяснилось, что населения региона распределяется по следующим типам в зависимости от размера располагаемого дохода. В форме диаграмм эти результаты показаны на рисунках 3.5–3.6.

Типы доходности населения Доля населения, %
1. Низкий уровень дохода 38,0
2. Доход ниже среднего 31,5
3. Средний уровень дохода 20,3
4. Доход выше среднего 6,2
5. Высокий уровень дохода 4,0

Рисунок 3.5. Секторная диаграмма. Структура населения региона по уровню располагаемых доходов.

Рисунок 3.6. Полосовая диаграмма Структура населения региона по уровню располагаемых доходов (%)

Для изображения процессов, протекающих во времени, применяют динамические (временные) диаграммы. Знаками-символами на таких диаграммах служат точки и последовательно соединяющие их линии (обычно, прямые), складывающиеся в ломаные кривые, дающие представление об изменение во времени изучаемого явления. Ось абсцисс является осью времени с равномерно размещенными отметками, а ось ординат – осью значений, которые принимает с течением времени изучаемый показатель. Конфигурация каждой кривой на динамической диаграмме отражает процесс изменения показателя во времени: его рост или падение (рисунок 3.7).

Рисунок 3.7. Валютный (обменный) курс рубля в 1998–1999 годах.

Для изображения рядов распределения (вариационных рядов) применяются диаграммы, построенные в прямоугольной системе координат. Ряд распределения показывает повторяемость определенного значения признака у единиц совокупности. Таким рядом является, например, распределение населения региона на группы (типы), в зависимости от уровня располагаемого дохода.

Группы населения Уровень дохода (руб. в месяц) Численность населения, %
1. До 750 28,6
2. 750 – 1350 32,5
3. 1350 – 1950 15,4
4. 1950 – 2700 13,3
5. 2700 – 3750 5,4
6. 3750 – 4650 2,3
7. 4650 – 6000 2,5
Итого

Интервальный ряд распределения отображается либо в форме гистограммы либо в форме кумуляты. Точки и линии гистограммы выражают число единиц совокупности, приходящееся на единичное значение признака в соответствующем интервале. Таким образом, гистограмма характеризует плотность распределения признака и является графическим аналогом кривой плотности распределения в теории вероятностей. В нашем примере для построения гистограммы предварительно определим значения плотностей в интервалах[2].

Гистограмма характерна тем, что вся ее площадь равна общему количеству единиц в совокупности (в данном случае это 100 %). Этот итог складывается из площадей прямоугольников, построенных на соответствующих интервалах. Площадь каждого прямоугольника равна произведению его основания (ширина интервала) на высоту (значение плотности в интервале). При равных интервалах плотность распределения прямо пропорциональна частотам или частостям, которые обычно и используются для построения прямоугольников. При неравных интервалах гистограмма строится только по значениям плотности.

Другим способом графического представления интервального ряда распределения является кумулята. Кумулятивная кривая (кумулята) изображается по сумме частот, накопленных к началу и концу каждого интервала. Пример гистограммы и кумуляты приведен на рисунках 3.8, 3.9.

Группы Уровень дохода
(руб. в месяц)
Численность населения,
%
Интервал изменения признака,
тыс. руб.
Уровень плотности
(процент населения на 1 тыс. руб. дохода)
Кумулятивные (накопленные) значения численности населения, %
1. До 750 28,6 0,750 38,133 28,6
2. 750 – 1350 32,5 0,600 54,167 61,1
3. 1350 – 1950 15,4 0,600 25,667 76,5
4. 1950 – 2700 13,3 0,750 17,733 89,8
5. 2700 – 3750 5,4 1,050 5,143 95,2
6. 3750 – 4650 2,3 0,900 2,555 97,5
7. 4650 – 6000 2,5 1,350 1,852
Итого

Рисунок 3.8. Гистограмма распределение населения региона
по уровню располагаемых доходов

Координаты точек на кумулятивной кривой показывают по вертикальной оси Y численность совокупности (в данном случае – долю населения), для которой максимальное значение признака не превышает указанное на оси Х. Таким образом, кумулятивная кривая это аналог кривой функции распределения в теории вероятностей. На графике видно, что у первой четверти населения (25 %) уровень дохода не превышает 0,70 тыс. руб. (точное значение первого квартиля – 692,6 руб./чел.), у половины населения (50 %) уровень дохода не превышает 1,1 тыс. руб. (медианное значение или второй квартиль равен 1109,7 руб.), для 75 % населения уровень дохода не выше 1900 руб./чел. (точное значение так называемого 3-го квартиля равно 1863,5 руб.).

При дискретной вариации признака графиком вариационного ряда служит полигон распределения. Полигон может быть построен, например, для распределения рабочих предприятия по признаку разряда, распределения квартир жилого дома по числу проживающих в них, распределения семей по количеству детей и т.д. Полигон распределения, представляет замкнутый многоугольник (учитывая его основание – ось Х), абсциссами вершин которого являются значения варьирующегося признака, а ординатами – соответствующие им частоты. Кумулята для дискретного ряда изображается аналогично интервальному ряду. Иногда накопленные частоты признака отображают в форме огивы. Огива это график, у которого по оси ординат отображаются уровни признака, а по оси абсцисс накопленные частоты (или частости).

Рисунок 3.9. Распределения населения региона по уровню располагаемых доходов (кумулята).

Из множества графиков, выполняющих специальные функции, рассмотрим графики концентрации и способы графического представления первичных не сгруппированных данных.

График концентрации позволяет наглядно представить характер размещения исследуемого объемного показателя по определенным с точки зрения того же показателя группам (типам) единиц совокупности. (Например, распределение общей суммы денежных доходов населения региона по типичным – с точки зрения доходности – группам населения). Графики этого вида наглядно представляют процессы концентрации и дают возможность сравнить глубину этих процессов по разным объемным показателям и статистическим совокупностям. Например, можно сопоставить степени концентрации доходов населения по различным регионам.

Для построения графика концентрации (кривой Лоренца) по оси абсцисс откладывают накопленные доли общего числа единиц совокупности (например, накопленные доли численности населения), а по оси ординат – накопленные доли по объему изучаемого показателя (общей суммы денежного населения). Чем дальше линия фактической концентрации (кривая Лоренца), построенная по указанным координатам, отклоняется от диагонали прямоугольника – линии равномерного распределения, – тем выше степень концентрации объемов изучаемого явления.

Отношение площади графика, ограниченной линией равномерного распределения и кривой Лоренца, к площади половины прямоугольника известно как коэффициент концентрации, известный как коэффициент Джини:

Здесь pi, pi+1 – накопленные суммы удельных весов в численности совокупности для i и (i+1) групп соответственно;

qi, qi+1 – накопленные суммы удельных весов по объемному признаку для i, (i+1) групп соответственно.

При расчете коэффициента концентрации (коэффициента Джини) значения удельных весов используются в форме обычных относительных величин (не процентов). Пример кривой концентрации доходов показан на рисунке 3.10. График построен по следующим данным.

Группы населения (i) Накопленная (кумулятивная) доля населения (qi) Накопленная (кумулятивная) доля доходов (pi)
0,003 0,00016
0,286 0,10309
0,611 0,33467
0,765 0,50934
0,898 0,72214
0,952 0,84031
0,975 0,9074
1,00 1,00

Как видно из графика, распределение общей суммы денежных доходов отклоняется от равномерного. В частности, на 50% населения региона приходится не более четверти (24,1%) общей суммы денежных доходов в условиях данного временного периода. Уровень концентрации дохода, определяемый через коэффициент Джини, равен 0,362.

Представляют интерес специальные способы графического отображения первичных данных в так называемом разведочном анализе. Для наглядной характеристики совокупности наблюдений используются обзорные рисунки (графики типа «Box and Whiskers» –«Ящик с усами») и графики симметрии («Stem and Leaf»). Для построения обзорного рисунка («Box and Whiskers») совокупность наблюдений предварительно сортируется по возрастанию признака, а затем делится на 4 равные части по численности. Далее последовательно определяется значение признака, которое отделяет первую часть наблюдений от второй (первый квартиль), вторую часть от третьей (второй квартиль), третью от четвертой или третий квартиль. Максимальное значение признака в совокупности является четвертым квартилем. На графике отрезками линий показывают положение минимального значения признака и всех 4 квартилей. Линии первого и третьего квартиля определяют положение "ящика". Внутри этого «ящика» как бы заключено 50% наблюдений со средними значениями признака. Минимальное и максимальное значение соединяются («Whiskers» – усы) со стенками этого "ящика". В пределах "ящика" оказывается линия второго квартиля (медианное значение признака, медиана)[3]. В итоге рисунок наглядно характеризует строение совокупности и симметричность исходных данных относительно медианы[4]. Пример графика "Box and Whiskers" приведен на рисунке 3.11. Наглядно видна некоторая асимметрия квартильных уровней относительно медианного значения.

Современные системы статистической обработки данных на ПЭВМ позволяют представить в графической форме наблюдения многомерные. Обычным способом представления многомерных наблюдений являются графики типа "Звезды" ("Stars") и "Лучи" ("Sun Rays"). Каждый объект показывается отдельным рисунком, размеры которого позволяют сравнить его с другими в той же исходной совокупности. На графике "Звезды" из центра каждого многомерного объекта через равный угол исходят оси, соответствующие отдельным признакам. На осях отмечаются уровни признаков, эти отметки соединяются линиями. Так как признаки имеют разные единицы измерения и масштабы числового представления, разметка осей выполняется в относительной форме. Максимальное значение признака соответствует 1.

Графики "Лучи" строятся по статистически стандартизованным данным, уровни признаков показываются в количестве средних квадратических отклонений. Здесь середина каждого луча соответствует среднему значению признака.

В графиках "Звезды" части осей, превышающие значения признака у соответствующего объекта, обычно не показываются (на рисунке 3.11 оси для наглядности сохранены полностью). На графиках "Лучи" координатные оси показываются полностью, длина каждой оси ("Луча") обычно находится в пределах от –3 до +3 средних квадратических отклонений.

Рисунок 3.10. Кривая концентрации доходов населения региона.

Рисунок 3.11. Обзорный рисунок («Box and Whiskers») уровня рентабельности производства на 53 предприятиях
(построен в системе STATISTICA).

Пример графического представления многомерных наблюдений для 4 объектов показан на рисунке 3.12 (х1 – уровень выработки; х2 — индекс себестоимости; х3 — уровень рентабельности; х4 — трудоемкость продукции; х5 — удельный вес рабочих в численности персонала).

Рисунок 3.12. Характеристики предприятий по признакам на графиках "Звезды".

Для анализа взаимосвязи применяют так называемые матричные графики, в которых взаимосвязь каждой пары признаков отображается корреляционным полем. Все корреляционные поля объединяются в одну общую матричную диаграмму. По расположения точек корреляционного поля и линии регрессии в каждой клетке матричной диаграммы делают заключение о направлении и тесноте статистической связи соответствующей пары признаков. Пример такой диаграммы приведен на рисунке 3.13.

Рисунок 3.13. Взаимосвязь признаков: фондоотдача, численность персонала, стоимость основных фондов
(диаграмма получена в системе STATISTICA)

Контрольные вопросы

1. Дайте определение сводки и группировки.

2. Виды статистических группировок

3. Методологические вопросы проведения статистических группировок

4. Понятие многомерной и комбинационной группировки

5. Понятие и элементы статистической таблицы

6. Понятие и основные виды статистических графиков


Ответить

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Вы можете использовать HTML- теги и атрибуты:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

− 4 = 5