Диаграммы сравнения. Диаграммы

Использование новых видов визуализаций в отчетах или всегда несет риск введения пользователей в заблуждение или снижения читабельности данных. Квадратная (или вафельная) диаграмма, не искажая понимания данных, является интересной альтернативой стандартным диаграммам Excel.

Как вы видите, вафельная диаграмма представляет из себя квадрат размером 10х10 ячеек, где 1 ячейка соответствует одному проценту из 100. Количество закрашенных ячеек соответствует значению показателя, который вы пытаетесь визуализировать. Данный вид графика будет интересен тем, кто хочет добавить новый вид диаграмм, не искажая данных и не занимая много места на дашборде.

Есть несколько способов реализации диаграмм данного вида. Описанный ниже метод использует инструменты встроенных диаграмм и хотя он сложнее в реализации (чем создание подобных графиков с помощью ), является более гибким и позволяет внедрять квадратные диаграммы любых размеров в любое место вашего дашборда.

В сегодняшней статье мы рассмотрим шаги по созданию диаграммы – вафли и научимся быстро их дублировать для визуализации стольких метрик, сколько вам необходимо.

Подготовка данных для вафельной диаграммы

Для начала необходимо создать три диапазона данных, которые будут играть определенную роль в построении диаграммы:

Горизонтальные линии: Данный диапазон необходим для построения горизонтальных линий. В нашем случае это будет ряд от 1 до 10.

Вертикальные линии: Диапазон поможет нам построить вертикальные линии и заполняется нулями.

Значение ячейки: Данный диапазон будет определять, какие ячейки буду закрашены. Он будет содержать формулу.

В ячейки диапазона Значение ячейки вставляем формулу =МАКС(МИН(E$3*100-($B6-1)*10;10);0) и протягиваем ее вниз.

Обратите внимание на (помечены знаком $). Это позволит быстро копировать и вставлять формулы, когда придет время дублировать диаграммы.

Формула, которую мы вставили в диапазон Значения ячейки, разбивает показатель KPI на группы, размером по 10 единиц. Обратите внимание, что после того, как мы протянули формулу, показатель 45% разбился на 5 групп, состоящих из 4 групп с целыми десятками и одна группа из неполной десятки (5%).

Если вы измените показатель на другое значение, например, 67%, формула разобьет его на 7 групп (6 – целых десяток, 1 – неполная).

На данном этапе мы имеем все данные для построения квадратной диаграммы.

Построение вафельной диаграммы

Создание вафельной диаграммы потребует от вас некоторых усилий. Но есть хорошая новость. Создав диаграмму, ее можно легко дублировать. Итак, алгоритм действий по шагам.

Строим линейчатую диаграмму с группировкой на основе данных диапазона Значения ячейки.

Копируем диапазоны Горизонтальны и вертикальные линии, выделяем диаграмму и вставляем данные.

Закрашиваем область построения в серый цвет, для этого щелкаем правой кнопкой по области построения. В выпадающем меню выбираем пункт Формат области построения. В появившейся панели Параметры области построения, переходим во вкладку Заливка и указываем понравившийся тон серого в пункте Цвет.

Далее необходимо превратить линейчатые диаграммы Горизонтальных и вертикальных линий в точечные. Для этого щелкаем по любому ряду данных правой кнопкой мыши, из выпадающего меню выбираем Изменить тип диаграммы для ряда. В появившемся диалоговом окне Изменение типа диаграммы выбираем для рядов данных Горизонтальные линии и Вертикальные линии из выпадающего списка Тип диаграммы – точечная.

Для ряда данных Горизонтальные линии необходимо добавить значения оси X. Щелкаем правой кнопкой мыши по ряду данных Горизонтальные линии, из выпадающего меню выбираем Выбрать данные. И добавляем диапазон Вертикальные линии, состоящий из нулей.

На данном этапе график должен иметь следующий вид.

Устанавливаем максимальное значение горизонтальной и вспомогательной вертикальной осей равным 10. Для этого щелкаем правой кнопкой мыши по шкале оси, из выпадающего меню выбираем Формат оси. Во всплывающей справа панели Параметры оси устанавливаем фиксированное максимальное значение равным 10. То же самое делаем для вертикальной вспомогательной оси.

Удаляем все шкалы осей. Выбираем ось и нажимаем клавишу Delete.

На следующем шаге необходимо , они будут играть роль разделителей. Для этого выбираем ряд данных Горизонтальные линии, щелкаем на плюсик, появившийся справа от диаграммы. Во всплывающем окне ставим галочку напротив поля Предел погрешностей. То же самое проделываем для ряда данных Вертикальные линии.

Нам понадобятся не все планки погрешностей, поэтому выделяем диаграмму, переходим во вкладку Работа с диаграммами –> Формат в группу Текущий фрагмент. Из выпадающего списка выбираем пункт Y и нажимаем клавишу Delete. Таким же образом выделяем элемент диаграммы X и тоже удаляем.

Из оставшегося списка выбираем элемент Ряд «Горизонтальные линии» предел погрешностей по оси X, в этой же группе вкладки Формат нажимаем Формат выделенного. В появившейся панели Параметры горизонтального предела погрешностей устанавливаем значения Направление – Плюс, Стиль края – Без точки, Величина погрешности – Фиксированное значение – 10. В этой же панели переходим во вкладку Заливка и границы и устанавливаем цвет линии Белый.

То же самое проделываем для элемента Ряд «Вертикальные линии» предел погрешностей по оси Y.

Далее щелкаем правой кнопкой по ряду данных Горизонтальные линии, в выпадающем меню выбираем Формат ряда данных, в панели Параметры ряда устанавливаем наличие маркера в положение Нет.

На этом этапе внешний вид нашей квадратной диаграммы должен иметь следующий вид.

Щелкаем правой кнопкой мыши по ряду данных Значение ячейки, выбираем из выпадающего меню пункт Формат ряда данных. В появившейся панели Параметры ряда устанавливаем Боковой зазор равным 0.

Растяните область построения графика таким образом, чтобы получился квадрат, также вы можете задать другой цвет ряду данных Значения ячейки.

Опционально, вы можете отобразить значение показателя в названии диаграммы. Для этого щелкаем по полю название диаграммы, в строке формул указываем адрес ячейки, которая содержит значение показателя.

На данном этапе вы имеете готовую вафельную диаграмму.

Клонирование вафельной диаграммы

Как мы и говорили ранее, хотя вам потребуются некоторые усилия для создания квадратной диаграммы, вам не нужно будет создавать ее каждый раз с нуля, чтобы визуализировать остальные показатели. Достаточно скопировать ее и указать новый набор данных.

Для начала вам необходимо будет продублировать диапазоны Значения ячейки.

Четверг, Март 27th, 2008

Полосовые диаграммы особенно наглядны при сравнении величин, связанных между собой элементов целого. В этом случае столбики размещаются не по вертикали, а по горизонтали, т.е. основание полос (объекты, данные) располагаются на оси ординат, а масштаб – на оси абсцисс. Ширина полос также (как столбцов в столбиковой диаграмме) должна быть одинаковой. Расстояние между ними берется одинаковым (обычно? или? ширины полос) или полосы строятся вплотную. Шкала горизонтальной полосовой диаграммы должна начинаться также с нуля, ее разрыв обычно не допускается. В столбиковой диаграмме точка разрыва может допускаться.

Posted in | 8 Comments »

Квадратные и круговые диаграммы

Четверг, Март 27th, 2008

В квадратных и круговых диаграммах сравниваемые статистические данные изображают в виде квадратов или кругов. Величина изображаемого явления выражается в этом случае размером площади фигуры (квадрата или круга). Чтобы изобразить квадратную диаграмму, необходимо из сравниваемых статистических данных извлечь квадратные корни, а затем построить квадраты со сторонами, пропорциональными полученным результатам (с учетом выбранного масштаба). В круговых диаграммах также извлекаются квадратные корни из сравниваемых статистических величин, предварительно разделенных на?=3,14. Устанавливается масштаб и строится круг с радиусом, пропорциональным (с учетом масштаба) вычисленной величине. Как и в столбиковых (полосовых) диаграммах, геометрические фигуры (квадраты, круги) строят на одинаковом друг от друга расстоянии. В отличие от столбиковых диаграмм масштаб измерения здесь можно не приводить, но в каждой геометрической фигуре следует указать то числовое значение, которое она изображает. Наглядное сравнение квадратных и круговых диаграмм затруднено тем, что приходится сравнивать площади, а не высоты (или ширины). Кроме того и построение их сложнее.

Posted in Виды статистических графиков. Графики сравнения | 11 Comments »

Фигурные диаграммы.

Четверг, Март 27th, 2008

На таких графиках величины изображаются при помощи фигур (или разных размеров, или разной численности фигур одинакового размера). В первом случае сначала определяется, что соответствует изображаемым числам: линейный размер фигуры (ее высота, длина) или ее площадь. В качестве фигур учитывается содержание рассматриваемого явления. Например, численность населения можно изобразить фигурой человека, численность тракторного парка – количеством фигур трактора или размерами трактора. Во втором случае построения фигурной диаграммы каждая фигура приравнивается к определенному числу (масштабу, части изображаемой статистической величины), а число одинаковых фигурок приравнивается статистической величине. При этом допускается дробление знака (фигурки) до половины и даже четверти фигурки. Фигурные диаграммы, если они грамотно и хорошо выполнены, фиксируют на себе внимание, очень понятны и доходчивы. Они часто используются как агитационный плакат.

Рассмотрим построение основных видов диаграмм на

конкретных числовых примерах.

На столбиковых диаграммах статистические данные

изображаются в виде вытянутых по вертикали

прямоугольников.

При построении столбиковых диаграмм необходимо выполнять

следующие требования:

1) шкала, по которой устанавливается высота столбика,

должна начинаться с нуля;

2) шкала должна быть, как правило, непрерывной;

3) основания столбиков должны быть равны между собой;

столбики могут быть размещены на одинаковом расстоянии

друг от друга, вплотную один к другому или наплывом, при

котором один столбик частично накладывается на другой;

4) наряду с разметкой шкалы соответствующими цифровыми

надписями следует снабжать и сами столбцы.

Пример . Изобразим графические данные о числе

негосударственных общеобразовательных школ России за

следующие учебные годы (на начало года), ед.: 1997/98 -

570; 1998/99 - 568; 1999/2000 - 607; 2000/01 - 635.

Исследуем негосударственные общеобразовательные

учреждения с помощью столбиковой диаграммы сравнения.

На горизонтальной оси поместим основания шести столбиков

на расстоянии 0,5 см друг от друга. Ширина столбиков - 1 см.

Масштаб на вертикальной оси - 10 ед. на 1 см (рис. 5.5).

На столбиковой диаграмме изображаемые величины

пропорциональны длине столбцов. Из диаграммы видно, что

число не-

Рис. 5.5. Число общеобразовательных негосударственных

школ России за 1997-2001 гг.

Пример . Построим квадратную диаграмму для сравнения

численности учителей и учащихся в негосударственных

школах за 2001 г. (на начало года). Для построения

диаграммы нужно извлечь квадратные корни из следующих

величин: численность учителей - 16 тыс. чел; численность

учащихся - 61 тыс. чел. Это составит соответственно 4; 7,81.

Чтобы построить по этим данным квадраты, необходимо

выбрать масштаб. Примем 1 см за 0,8 тыс. чел.

Сторонами квадратов на графике будут отрезки,

пропорциональные полученным числам (рис. 5.6). Таким

образом квадрат-

Рис. 5.6. Численность учащихся и учителей в

негосударственных школах России на начало 2001 года (тыс.

Пример . Изобразим динамику производства часов в одном из

регионов России за 1999 - 2002 гг. с помощью диаграммы

фигур-знаков. Условно примем один рисунок за 1000 штук

часов. Тогда число часов: в 1999 г. в размере 4717 шт.

должно быть изображено в количестве 4,7 рисунка; в 2000 г.

в размере 3672 шт. - 3,7 рисунка; в 2001 г. в размере 3987 шт

3,99 рисунка; в 2002 г. в размере 2189 шт. - 2,2 рисунка

Рис. 5.8. Производство часов в одном из регионов России в

Секторные диаграммы удобно строить следующим образом:

вся величина явления принимается за 100%, рассчитываются

доли отдельных его частей в процентах. Круг разбивается на

секторы пропорционально частям изображаемого целого.

Таким образом, на 1% приходится 3,6°. Для получения

центральных углов секторов, изображающих доли частей целого, необходимо их

процентное выражение умножить на 3,6°.

Пример . Изобразим с помощью секторной диаграммы число

студентов негосударственных вузов России на начало 2000/01

учебного года по формам обучения. На дневной форме

обучается 39% студентов; на вечерней - 9%; на заочной -

51%; на экстернате - 1% студентов. Построим круг

произвольного радиуса. По данным о числе студентов, для

построения секторов определим центральные углы: для

дневной формы центральный угол составил 140,4" (41,0 ¦

3,6); для вечерней - 32,4°(9 3,6); для заочной -183,6° (51

3,6); для экстерната - 3,6° (1 ¦ 3,6). При помощи

транспортира разделим круг на соответствующие сектора

Рис. 5.9. Структура форм обучения студентов государственных

и негосударственных вузов России на начало 2000/01

учебного года

Если данные о структуре какого-либо явления выражаются в

абсолютных величинах, то для нахождения секторов

необходимо 360° разделить на величину целого, а затем

частное от деления последовательно умножить на абсолютные

значения частей.

Для одновременного сопоставления трех величин, связанных

между собой таким образом, что одна величина является

произведением двух других, применяют диаграммы,

называемые «знак Варзара».

Знак Варзара представляет собой прямоугольник, у которого

одни сомножитель принят за основание, другой - за высоту, а

вся площадь равна произведению.

Пример . Имеются данные по сбору яровой пшеницы в одном

из регионов России в 2003 г., в котором при посевной

площади 14,5 млн. га урожайность составила 1,16 т/га.

В нашем случае в основание прямоугольника положена

урожайность яровой пшеницы, высота - посевная площадь, а

площадью прямоугольника является валовой сбор яровой

пшеницы. Правильность показаний диаграммы можно

проверить простыми математическими вычислениями:

посевная площадь = валовой сбор /урожайность =16800000 /

1,16 = 14482758 га (рис. 5.10).

Рис.

Рис. 5.10. Зависимость валового сбора яровой пшеницы

от урожайности и посевной площади в одном из регаонов

России 2003 с

Линейные диаграммы широко применяются для

характеристики изменений явлений во времени, выполнения

плановых заданий, а также для изучения рядов

распределения, выявления связи между явлениями. Линейные

диаграммы строятся на координатной сетке. Геометрическими

знаками в линейных диаграммах служат точки и

последовательно соединяющие их отрезки прямой, которые

складываются в ломаные кривые.

Пример . При помощи линейной диаграммы можно изобразить

данные о конкурсе на вступительных экзаменах в высшие

учебные заведения в России за 1996 - 2000 гг.; на одного

зачисленного приходится державших экзамены:

Год 1996 1997 1998 1999 2000

Конкурс, чел. 1,8 1,7 1,8 1,9 1,9

В прямоугольной системе координат нанесем на ось ординат

данные о конкурсе абитуриентов (рис. 5.11). Масштаб - 1 см

0,05 чел. Из графика видно, что положение кривой

определяется не только данными о конкурсе, но и

интервалами времени между датами.

Нередко на одной линейной диаграмме приводятся несколько

кривых, которые дают сравнительную характеристику дина-

Рис. 5.11. Конкурс на вступительных экзаменах в высшие

учебные заведения России за 1996-2000 гг. (на одного

зачисленного, приходится державших экзамены, чел.)

мики различных показателей или одного и того же показателя

для разных территорий. Методика построения таких кривых не

отличается от построения графика на рис. 5.11. Из данных

рис. 5.11 видно, как меняется конкурс в вузы за 1996 - 2000

гг. В 1997 г. конкурс заметно снизился по сравнению с

конкурсом в 1996 г. Однако с 1997 г. конкурс в высшие

учебные заведения возрастал и в 1999 г. превысил конкурс

1996 г. С 1999 по 2000 г. конкурс в вузы России оставался

неизменным.

Ряды распределения чаще всего изображаются в виде

полигона или гистограммы . Полигон строят в основном для

изображения дискретных рядов. При его построении на оси

абсцисс откладываются значения варьирующего признака, а

на оси ординат - абсолютные или относительные численности

единиц совокупности (частоты или частости). Полигон на рис.

5.12 построен на основании (условных) данных о

распределении семей по числу детей.

Рис. 5.12. Полигон распределения семей по числу детей в

одном из регионов в 2003 г.

Гистограмма распределения применяется чаще всего для

изображения интервальных рядов. Для ее построения по оси

абсцисс откладываются интервалы признака, а по оси ординат

Численности единиц совокупности. На отрезках,

изображающих интервалы, строят прямоугольники, площади

которых пропорциональны численностям единиц (рис. 5.13).

Рис. 5.13. Гистограмма распределения фирм в одной из

отраслей по стоимости основных производственных фондов

В ряде случаев для изображения вариационных рядов

используется кумулятивная кривая (кумулята). Для ее

построения значения варьирующего признака откладываются

на оси абсцисс, а на оси ординат помещаются накопленные

итоги частот или частостей (рис. 5.14).

Из Елисеевой

4.2. Основные виды графиков

Статистические таблицы дополняются графиками в том случае,

когда ставится цель подчеркнуть какую-то особенность данных,

провести их сравнение. Графики являются самой эффективной

формой представления данных с точки зрения восприятия.

Часто графики используются и вне связи с таблицей. С

помощью графиков достигается наглядность характеристики

структуры, динамики, взаимосвязи явлений, их сравнения.

Статистические графики представляют собой условные

изображения числовых величин и их соотношений посредством

линий, геометрических фигур, рисунков или географических

карт-схем.

Графический способ облегчает рассмотрение статистических

данных. На графике сразу видны пределы изменения

показателя, сравнительная скорость изменения разных

показателей, их колеблемость. Вместе с тем график имеет

определенные ограничения: прежде всего не может включить

столько данных, сколько может войти в таблицу; кроме того, на

нем показываются всегда округленные данные - не точные, а

приблизительные. Таким образом, график используется только

для изображения общей ситуации, а не деталей. Последний

минус - трудоемкость построения. Но этот недостаток может

быть преодолен применением пакетов прикладных программ

(ППП) для компьютерной графики, например ППП «Harvard

По способу построения графики делятся на диаграммы,

картограммы и картодиаграммы.

Наиболее распространенными являются диаграммы. Они

бывают разных видов: линейные, радиальные, точечные,

плоскостные, объемные, фигурные. Вид диаграммы зависит от

вида представляемых данных (одна переменная или один

показатель, несколько переменных или показателей,

количественные или неколичественные) и задачи построения

Рис. 4.1. Динамика выбросов вредных веществ в атмосферу

в Санкт-Петербурге

определен.

корреляции).

является полигон распределения, второго - линРис. 4.1. Динамика выбросов вредных веществ в атмосферу

и индекса физического объема промышленного производства

в Санкт-Петербурге

В любом случае график обязательно сопровождается

заголовком - над или под полем графика. В заголовке

указывается, какой показатель изображен, в каких единицах

измерения, по какой территории и за какое время он

определен.

Линейные графики используются для представления

количественных переменных: характеристики вариации их

значений, динамики, взаимосвязи между переменными.

Вариация данных анализируется с помощью полигона

распределения, кумуляты (кривой «не меньше, чем») и огивы

(кривой «больше, чем»). Линейные графики используются в

решении задач классификации данных. Линейные графики

применяются в анализе динамики связей. В анализе

используются точечные диаграммы (так называемое поле

корреляции).

Линейные графики целесообразно разделять на используемые

для представления данных по одной переменной - одномерные

или по двум переменным - двумерные. Примером первого

является полигон распределения, второго - линия регрессии.

Возможен такой случай, когда на графике представлено несколько переменных (показателей), а он все-таки

не является многомерным (рис. 4.1).

Для того чтобы динамика двух и более показателей была

сопоставимой, следует обеспечить их «единый старт», как на

рис. 4.1, где показатели 1990 г. приняты за 100%.

;

О--------оценка произошедших изменений экономической

ситуации в России;

О- - оценка ожидаемых изменений экономической ситуации в

Л-- - оценка произошедших изменений личного

материального положения;

-*-¦ -оценка ожидаемых изменений личного материального

положения;

- - ¦ - - - оценка благоприятности условий для крупных покупок

кв. - май, III кв. - август, IV кв. - ноябрь)

Динамика двух показателей на одном и том же графике может

быть представлена и без приведения их к 100%, если эти

показатели связаны каким-либо функциональным

соотношением (например, представлена динамика общего

показателя и показателя, который является одним из его

составляющих). Примером такого графика является рис. 4.2.

При графическом изображении динамики по оси абсцисс

показывается время (годы, кварталы, месяцы); по оси ординат

Значения показателей или показателя (рис. 4.3, а). При этом

ось ординат должна иметь начало в точке «О». Иногда вместо

нулевой точки в качестве начального уровня на оси ординат

показывается уровень какого-либо года. Это делается втом

случае, если изменения изображаемого показателя

значительны - в 8-10 раз и более в течение рассматриваемого

Правильнее указать нулевую точку, а затем (если нужно)

«разорвать» ось ординат так, как это показано на рис. 4.3, б.

Иногда при больших изменениях показателя прибегают к

логарифмической шкале. Предположим, значения показателя

изменяются от 1 до 100 (в 100 раз); это может вызвать

затруднения при построении графика. Если перейти к

логарифмам, то их значения для минимальных (максимальных)

значений показателя будут различаться не так сильно: log 1 =

Среди плоскостных диаграмм по частоте использования

выделяются столбиковые диаграммы, на которых показатель

представляется в виде столбика, высота которого соответствует

значению показателя. Пример столбиковой диаграммы

представлен на рис. 4.4. Часто на столбиковой диаграмме

показываются относительные величины: при сравнении

показателей по группам, по разным совокупностям, одна из

которых может быть принята за 100%.

Пропорциональность площади той или иной геометрической

фигуры величине показателя лежит в основе других видов

плоскостных диаграмм: треугольных, квадратных,

прямоугольных. В треугольной диаграмме нужно так выбрать

стороны и высоту треугольника, чтобы его площадь отвечала

величине показателя. Для построения квадратной диаграммы

нужно задать размер одной стороны, прямоугольной - двух__

сторон. Можно использовать и сравнение площадей круга; в

этом случае задается радиус окружности.

Ленточная диаграмма представляет показатели в виде

горизонтально вытянутых прямоугольников. Как столбиковые,

так и ленточные диаграммы можно применять не только для

сравнения самих величин, но и для сравнения их частей (рис.

Особый тип ленточных диаграмм применяется для

представления данных с разным характером изменений:

положительным и отрицательным (рис. 4.7).

Диаграмма, изображенная на рис. 4.7, может использоваться,

например, для представления регионов с разной величиной и

характером миграционного сальдо (положительным и

отрицательным) предприятий, на которых повысилась и

понизилась оплата труда и т.д.

Из плоскостных диаграмм часто используется секторная

диаграмма. Она применяется для иллюстрации структуры

изучаемой совокупности. Вся совокупность принимается за

го показателя. Площадь фигуры соответствует величине

показателя (рис. 4.10).

Если, например, вы решите использовать фигурную диаграмму

для изображения структуры безработных женщин, среди

которых 47% - молодые женщины (20-24 года) и девушки

16-19 лет, не имеющие стажа работы; 28% - инженерно-

технические работники и служащие со специальным

образованием в возрасте 25-49 лет и 15% - работницы

квалифицированного и неквалифицированного труда в возрасте

50 лет и старше, то должны изобразить три женские фигуры,

причем первая из них должна быть в два раза больше второй, а

вторая - почти в два раза больше третьей.

При построении графика одинаково важно все - правильный

выбор вида графического изображения пропорций, соблюдение

правил оформления. Подробнее все эти вопросы освещаются в

Разнообразные виды графиков позволяют получить ППП для

ПЭВМ «Harvardgraphics», «Supercalc», «Statictica», «Statgraphics

» и др. На графическом представлении основаны

некоторые процедуры классификации (группировки) данных,

анализа динамики: выявление тенденции, сравнение динамики

разных показателей и т.д.

Наконец, сам процесс обобщения статистических данных можно

представить графически (рис. 4.11). Изображен весь массив

собранных данных, т.е. таблица «объект-признак», полученная

за ряд периодов. Например, собраны данные по промышленным

предприятиям на данной территории по многим

характеристикам за каждый месяц. Это можно представить в

виде параллелепипеда, что и сделано на рис. 4.11.

Третье измерение может быть не временем, а определенной

территорией, т.е. каждая таблица «объект-признак» относится

к определенной территории (району, области и т.д.). На

последующих рисунках показано, что каждый из подмас-сивов,

взятых из рис. 4.12, а, может выделяться и разрабатываться

самостоятельно (б); на рис. 4.12, ваг показано, что данные

могут подразделяться по регионам, по кварталам и, наконец, по

подразделение данных по трем основаниям: по времени,

Линейный график. Для построения применяется система прямо - угольных координат. На оси абсцисс (горизонтальной) откладываются варианты изучаемого показателя (или времени), а на оси ординат - величина изучаемого показателя. При построении линейного графика очень важно правильно выбрать масштаб. Важным достоинством линейных графиков является то, что на одном и том же поле графика можно изобразить несколько показателей, что позволяет сравнивать и выявлять специфику их развития. Пример линейного графика приведен на рис. 2.

Диаграмма - это график, на котором статистическая информация изображается посредством геометрических фигур. Диаграммы применяются для наглядного сопоставления социально-экономических явлений в пространстве и анализа их динамики. При построении диаграмм с использованием программного обеспечения (в том числе MS Excel) масштабирование осуществляется автоматически. Пользователь может осуществить дополнительно настройку форматов осей и координатной сетки (частота указаний меток категорий, в каком значении оси должны пересекаться и т.п.). Чаще других на практике применяют столбиковые диаграммы. В MS Excel столбиковые диаграммы называются гистограммами.

Столбиковые диаграммы применяются для сравнения статистических показателей, характеризующих разные объекты или одни и те же объекты в разные годы. Могут использоваться в плоском (двумерном) и объемном (трехмерном) изображении.

При построении столбиковых диаграмм каждое значение статистического показателя изображается в виде вертикального столбика. Столбики строятся в прямоугольной системе координат. По оси абсцисс размещаются основания столбиков, ширина и расстояние между которыми выбираются произвольно, но должны быть одинаковыми. Высота столбиков меняется в зависимости от величины статистического показателя. На одном графике возможно одновременное изображение нескольких показателей. Пример плоской столбиковой диаграммы приведен на рис. 3.

Более наглядная разновидность столбиковых диаграмм - объемная диаграмма, которая позволяет легко сравнивать статистические данные между собой и одновременно видеть их развитие в динамике. Пример объемной диаграммы приведен на рис. 4.

Полосовые (ленточные) диаграммы. В полосовых диаграммах основания столбиков располагаются вертикально, а масштабная шкала наносится на горизонтальную ось и определяет величину полос по длине соответствующих значениям изображаемых статистических показателей. При построении полосовых диаграмм соблюдаются те же требования, что и при построении столбиковых диаграмм. Пример полосовой диаграммы приведен на рис. 5.


Круговые (секторные) диаграммы. Различные виды круговых диаграмм используются для изображения структуры одной статистической совокупности. Площадь круга принимается за величину всей совокупности, а площади отдельных секторов отображают удельный вес (долю) ее составных частей. Лучше всего структуру отображать в процентах. Тогда весь круг равен 100%.

Круговой диаграммой отражаются показатели, являющиеся частями одного целого. Например, с помощью круговой диаграммы можно наглядно показать структуру судимости по основным составам преступлений за требуемый период (рис. 6 и 7).


Замечание. Распространенной ошибкой является случай, когда для отображения каких-либо значений одного или нескольких показателей за ряд лет используют круговую диаграмму. Для графического изображения таких данных следует использовать столбиковую диаграмму.

Радиальные диаграммы. В радиальных диаграммах началом отсчета служит центр окружности, а носителями масштабных шкал являются радиусы круга. В приложении MS Excel такой вид диаграммы носит название лепестковой, являющейся аналогом графика в полярной системе координат. Пример радиальной диаграммы приведен на рис. 8.

На радиусах откладываются значения показателей интенсивности преступности по федеральным округам.

Статистические карты используются для характеристики распределения явления на определенной территории. Статистические карты делятся на картограммы и картодиаграммы. Различие между ними состоит в способах отображения статистических данных на картах.

Картограмма представляет собой географическую карту или схему, на которой при помощи некоторых условных знаков (штриховка, окраска или точки) показана степень распространения того или иного явления в пространстве (например, уровень преступности по округам, плотность населения и т.д.). Программное обеспечение, позволяющее пользователю строить картограммы, обычно включает средства геоинформационных систем (набор электронных карт с административно-территориальным делением) и инструмент для настройки отображения диапазона градаций данных (палитру цветов).

На рис. 9 приведен пример картограммы по абсолютному числу зарегистрированных преступлений по субъектам Российской Федерации в 2008 г.

Замечание. При построении картограмм возможны ситуации, когда наименование административно-территориального деления невозможно поместить на картограмме (существенно выходит за его границы или нужно использовать очень мелкий шрифт). В этом случае наименования меток выносят в пояснение - легенду. Таким образом, часть территорий имеет наименования на карте, а часть указывают цифрами, значения которых представляют в таблице.

Картодиаграмма - это сочетание географической карты или ее схемы с диаграммой. Различные фигуры при этом ставятся не в ряд, как на обычной диаграмме, а разносятся в определенном масштабе по всей карте в соответствии с тем районом, который они представляют. Картодиаграмма не только дает представление о величине изучаемого показателя на различных территориях, но и изображает пространственное размещение изучаемого показателя. С помощью картодиаграмм можно отразить более сложные статистико-географические сопоставления по сравнению с картограммами. Пример картодиаграммы приведен на рис. 10.

На картодиаграмме представлены статистические данные за 2002 г. по Уральскому федеральному округу: по объемам произведенной промышленной продукции - по окраске территорий, а по уровню заработной платы - в виде столбчатой диаграммы в долевом выражении. Сравнение осуществляется визуально как между отраслями хозяйства внутри региона, так и между регионами, при этом сами значения не отображены.

Основные типы диаграмм

В настоящее время, благодаря широкому использованию персональных компьютеров и пакетов специализированных прикладных программ, фактически не существует никаких ограничений, которые ранее диктовались трудоемкостью создания тех или иных типов диаграмм.

Фигурные диаграммы наиболее целесообразно применять при демонстрации каких-либо данных для широкой аудитории, не имеющей специальной подготовки (санитарно-просветительная работа, массовая агитация и т. п.) (рис. 1).

Рисунок 1. Патологическая пораженность (количество заболеваний) на 1000 студентов КрасГМУ по данным медицинского осмотра в 2009 году


Линейные диаграммы - наиболее распространенный вид диаграмм. Применяется для отображения практически любых статистических величин. Этот вид графических изображений относится к координатным диаграммам, т.е. диаграммам, использующим координатную систему. Для более наглядного отображения различий кроме обычных координатных осей рекомендуется использовать координатную сетку (рис. 2).

Рисунок 2. Динамика численности населения России с 1897 г. по 2004 г.

Столбиковые диаграммы представляют собой изображения различных величин в виде расположенных в высоту прямоугольников одинаковой толщины и разной высоты. Построение столбиковой диаграммы требует только одной масштабной шкалы, которая задает высоту столбика. Такие диаграммы применяются для отображения практически всех абсолютных и производных статистических показателей (рис. 3).

Рисунок 3. Динамика заболеваемости взрослого населения

Красноярского края в 2001-2006 гг.

Особым типом столбиковых диаграмм, который используется для иллюстрации плана, графика работ по какому-либо проекту является ленточная диаграмма (диагра́мма Га́нта). При этом, каждый раздел плана изображается в виде столбика, пропорционального по размерам его длительности.

Для отражения изменений экстенсивных показателей более целесообразно использовать внутристолбиковые диаграммы (рис. 4).

Рисунок 4. Структура посещений врачей поликлиник Красноярского края в 1999-2003 гг.

Показательной для отображения экстенсивных показателей является секторальная диаграмма (рис. 5).

Рисунок 5. Структура причин смерти в Красноярском крае в 2006 г.

Для отображения сезонных и циклических явлений оптимальным вариантом является радиальная диаграмма (рис. 6).

Рисунок 6. Зависимость расстояния проживания от реки Енисей и числа посещений по поводу болезней лор-органов и органов дыхания на 1000 детей г. Красноярска (в 2005 году)

Главным критерием выбора той или иной диаграммы для отображения статистических показателей является наглядность и удобство анализа результатов. Например: если анализируется сравнительная заболеваемость мужчин и женщин, то более целесообразно представить попарно сгруппированные показатели мужчин и женщин.

Картограмма – это географическая карта или ее схема, на которой приведены определенные статистические данные (с помощью цветовой гаммы или различной штриховки территорий).

Картодиаграмма – это сочетание географической карты или ее схемы с различными диаграммами, представляющими статистические данные, относящиеся к определенным территориям.

Коробчатую диаграмму называют «коробкой с усами», «ящиком с усами», а по-английски boxplot. Данный тип визуализации данных одновременно изображает пять величин, характеризующих вариационный ряд: минимальное значение, первую квартиль (или 25 процентиль), медиану, третью квартиль (75 процентиль), максимальное значение. Таким образом, польза коробчатой диаграммы заключается в том, что на ней не только представлены основные характеристики распределения, но и доступен для оценки размах вариации, и ее асимметрия. Коробчатые диаграммы очень компактны, с их помощью удобно сравнивать характер распределения в нескольких рядах.

Коробчатая диаграмма может быть как вертикальной, так и горизонтальной. Основой ее является прямоугольник, нижняя (левая, если график горизонтальный) сторона – это нижний квартиль (Q1), а верхняя (правая) – верхний квартиль (Q3). Высота (длина) прямоугольника, таким образом, равна межквартильному интервалу (IQR). Черта поперек прямоугольника – это медиана распределения (рис. 7).


Рисунок 7. Особенности коробчатой диаграммы

Гистограмма характеризует распределение количественного признака, применяется для графического изображения интервальных рядов распределения. Внешне она представляет собой многоугольник, построенный с помощью смежных четырехугольников. Ширина основания каждого четырехугольника соответствует границам группы вариант. Высота столбика определяется частотой группы. На шкале «Х» в выбранном масштабе откладываются интервалы значений переменной. Интервалы не должны перекрывать друг друга или иметь пропуски возможных значений переменной. На оси «Х» указываются центр или границы каждого интервала. Ось «Y» служит шкалой плотности, т.е. на ней откладываются абсолютные (число наблюдений) или относительные значения (доля, процент наблюдений) на единицу шага значения переменной. В простейшем варианте (при условии одинаковой ширины интервалов на оси Х) шаг целого интервала принимается за 1.

Общее число (или долю) наблюдений характеризует не высота столбца, а его площадь. Высота столбца отражает плотность распределения признака в определенном интервале его значений. Площадь всех столбцов гистограммы должна равняться 100% (при относительной шкале плотности) или общей сумме наблюдений (при абсолютной шкале плотности).

Одновременное изображение на гистограмме кривой нормального распределения позволяет зрительно оценить, насколько эмпирическое распределение отличается от нормального (рис. 8).


Рисунок 8. Пример гистограммы с кривой нормального распределения: гистограмма возраста обследованных лиц



Статьи по теме: