Построить интервальный вариационный ряд распределения. Построение дискретного вариационного ряда

Представляются в виде рядов распределения и оформляются в виде .

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

  • Атрибутивными — называют ряды распределения, построенные по качественными признакам.
  • Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант , выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:
  • Полигона
  • Гистограммы
  • Кумуляты
  • Огивы

Полигон

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

6.1. Распределение домохозяйств по размеру

Условие : Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача : Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение :
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие : Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача : Построить интервальный вариационный ряд с равными интервалами.
Решение :

  1. Исходная совокупность состоит из 20 единиц (N = 20).
  2. По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
  3. Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
  4. Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
  5. Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Гистограмма

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис. 6.2. Распределение населения России по возрастным группам

Условие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы

Задача : Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение :

  1. Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
  2. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
    Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.
  3. Построим гистограмму:

Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.

Кумулята

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределения домохозяйств по размеру

4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.

Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.

6.4. Кривая концентрации

Высшего профессионального образования

«РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА И

ГОСУДАРСТВЕННОЙ СЛУЖБЫ ПРИ ПРЕЗИДЕНТЕ

РОССИЙСКОЙ ФЕДЕРАЦИИ»

(Калужский филиал)

Кафедра естественнонаучных и математических дисциплин

КОНТРОЛЬНАЯ РАБОТА

По дисциплине «Статистика»

Студент___Майборода Галина Юрьевна______

Заочного отделения факультет Государственное и муниципальное управление группа Г-12-В

Преподаватель ____________________ Хамер Г.В.

К.п.н., доцент

Калуга-2013 г.

Задача 1.

Задача 1.1. 4

Задача 1.2. 16

Задача 1.3. 24

Задача 1.4. 33

Задача 2.

Задача 2.1. 43

Задача 2.2. 48

Задача 2.3. 53

Задача 2.4. 58

Задача 3.

Задача 3.1. 63

Задача 3.2. 68

Задача 3.3. 73

Задача 3.4. 79

Задача 4.

Задача 4.1. 85

Задача 4.2. 88

Задача 4.3. 90

Задача 4.4. 93

Список использованных источников. 96

Задача 1.

Задача 1.1.

Имеются следующие данные о выпуске продукции и сумме прибыли предприятиями области (таблица 1).

Таблица 1

Данные о выпуске продукции и сумме прибыли предприятиями

№ предприятия Выпуск продукции, млн. руб. Прибыль, млн. руб. № предприятия Выпуск продукции, млн. руб. Прибыль, млн. руб.
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

По исходным данным:

1. Постройте статистический ряд распределения предприятий по выпуску продукции, образовав пять групп с равными интервалами.

Постройте графики ряда распределения: полигон, гистограмму, кумуляту. Графически определите значение моды и медианы.

2. Рассчитайте характеристики ряда распределения предприятий по выпуску продукции: среднюю арифметическую, дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Сделайте вывод.

3. Методом аналитической группировки установите наличие и характер корреляционной связи между стоимостью произведенной продукции и суммой прибыли на одно предприятие.

4. Измерьте тесноту корреляционной связи между стоимостью произведенной продукции и суммой прибыли эмпирическим корреляционным отношением.

Сделайте общие выводы.

Решение:

Построим статистический ряд распределения

Для построения интервального вариационного ряда, характеризующего распределение предприятий по объему выпуска продукции, необходимо вычислить величину и границы интервалов ряда.

При построении ряда с равными интервалами величина интервала h определяется по формуле:

х max и х min – наибольшее и наименьшее значения признака в исследуемой совокупности предприятий;

k - число групп интервального ряда.

Число групп k задано в условии задания. k = 5.

х max = 81 млн. руб., х min = 21 млн. руб.

Расчет величины интервала:

млн. руб.

Путем последовательного прибавления величины интервала h = 12 млн. руб. к нижней границе интервала, получаем следующие группы:

1 группа: 21 – 33 млн. руб.

2 группа: 33 – 45 млн. руб.;

3 группа: 45 – 57 млн. руб.

4 группа: 57 – 69 млн. руб.

5 группа: 69 – 81 млн. руб.

Для построения интервального ряда необходимо подсчитать количество предприятий, входящих в каждую группу (частоты групп ).

Процесс группировки предприятий по объему выпуска продукции представлен во вспомогательной таблице 2. Графа 4 этой таблицы необходима для построения аналитической группировки (пункт 3 задания).

Таблица 2

Таблица для построения интервального ряда распределения и

аналитической группировки

Группы предприятий по объему выпуска продукции, млн. руб. № предприятия Выпуск продукции, млн. руб. Прибыль, млн. руб.
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Всего 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Всего 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Всего 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Всего 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Всего 229,0 26,9
Итого 183,1

На основе групповых итоговых строк «Всего» таблицы 3 формируется итоговая таблица 3, представляющая интервальный ряд распределения предприятий по объему выпуска продукции.

Таблица 3

Ряд распределения предприятий по объему выпуска продукции

Вывод. Построенная группировка показывает, что распределение предприятий по объему выпуска продукции не является равномерным. Наиболее часто встречаются предприятии с объемом выпуска продукции от 45 до 57 млн. руб. (12 предприятий). Наименее часто встречаются предприятий с объемом выпуска продукции от 69 до 81 млн. руб. (3 предприятия).

Построим графики ряда распределения.

Полигон чаще используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения аргумента, т. е. варианты (для интервальных вариационных рядов в качестве аргумента принимают середину интервала) а на оси ординат - значения частот . Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Полигон представлен на рисунке 1.

Гистограмма – столбиковая диаграмма. Она позволяет оценить симметричность распределения. Гистограмма представлена на рисунке 2.

Рисунок 1 – Полигон распределения предприятий по объему

выпуска продукции

Мода

Рисунок 2 – Гистограмма распределения предприятий по объему

выпуска продукции

Мода – значение признака, которое встречается наиболее часто в исследуемой совокупности.

Для интервального ряда графически моду можно определить по гистограмме (рисунок 2). Для этого выбирается самый высокий прямоугольник, который в данном случае является модальным (45 – 57 млн. руб.). Затем правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения.

Млн. руб.

Вывод. В рассматриваемой совокупности предприятий наиболее часто встречаются предприятия с выпуском продукции в 52 млн. руб.

Кумулята – ломаная кривая. Она строится по накопленным частотам (рассчитаны в таблице 4). Кумулята начинается с нижней границы первого интервала (21 млн. руб.), накопленная частота откладывается в верхней границе интервала. Кумулята представлена на рисунке 3.

Медиана

Рисунок 3 - Кумулята распределения предприятий по объему

выпуска продукции

Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

В интервальном ряду медиану можно определить графическим методом по кумулятивной кривой. Для определения медианы из точки на шкале накопленных частот, соответствующей 50% (30:2 = 15), проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Млн. руб.

Вывод. В рассматриваемой совокупности предприятий половина предприятий имеют объем выпуска продукции не более 52 млн. руб., а другая половина – не менее 52 млн. руб.


Похожая информация.


Если изучаемая случайная величина является непрерывной, то ранжирование и группировка наблюдаемых значений зачастую не позволяют выделить характерные черты варьирования ее значений. Это объясняется тем, что отдельные значения случайной величины могут как угодно мало отличаться друг от друга и поэтому в совокупности наблюдаемых данных одинаковые значения величины могут встречаться редко, а частоты вариантов мало отличаются друг от друга.

Нецелесообразно также построение дискретного ряда для дискретной случайной величины, число возможных значений которой велико. В подобных случаях следует строить интервальный вариационный ряд распределения.

Для построения такого ряда весь интервал варьирования наблюдаемых значений случайной величины разбивают на ряд частичных интервалов и подсчитывают частоту попадания значений величины в каждый частичный интервал.

Интервальным вариационным рядом называют упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений величины.

Для построения интервального ряда необходимо:

  1. определить величину частичных интервалов;
  2. определить ширину интервалов;
  3. установить для каждого интервала его верхнюю и нижнюю границы ;
  4. сгруппировать результаты наблюдении.

1 . Вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке.

Приблизительно число интервалов k можно оценить исходя только из объема выборки n одним из следующих способов:

  • по формуле Стержеса : k = 1 + 3,32·lg n ;
  • с помощью таблицы 1.

Таблица 1

2 . Обычно предпочтительны интервалы одинаковой ширины. Для определения ширины интервалов h вычисляют:

  • размах варьирования R - значений выборки: R = x max - x min ,

где x max и x min - максимальная и минимальная варианты выборки;

  • ширину каждого из интервалов h определяют по следующей формуле: h = R/k .

3 . Нижняя граница первого интервала x h1 выбирается так, чтобы минимальная варианта выборки x min попадала примерно в середину этого интервала: x h1 = x min - 0,5·h .

Промежуточные интервалы получают прибавляя к концу предыдущего интервала длину частичного интервала h :

x hi = x hi-1 +h .

Построение шкалы интервалов на основе вычисления границ интервалов продолжается до тех пор, пока величина x hi удовлетворяет соотношению:

x hi < x max + 0,5·h .

4 . В соответствии со шкалой интервалов производится группирование значений признака - для каждого частичного интервала вычисляется сумма частот n i вариант, попавших в i -й интервал. При этом в интервал включают значения случайной величины, большие или равные нижней границе и меньшие верхней границы интервала.

Полигон и гистограмма

Для наглядности строят различные графики статистического распределения.

По данным дискретного вариационного ряда строят полигон частот или относительных частот.

Полигоном частот x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат - соответствующие им частоты n i . Точки (x i ; n i ) соединяют отрезками прямых и получают полигон частот (Рис. 1).

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; W k ). Для построения полигона относительных частот на оси абсцисс откладывают варианты x i , а на оси ординат - соответствующие им относительные частоты W i . Точки (x i ; W i ) соединяют отрезками прямых и получают полигон относительных частот.

В случае непрерывного признака целесообразно строить гистограмму .

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h , а высоты равны отношению n i / h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии n i / h .

Практическое занятие 1

ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ

Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Существует 3 вида ряда распределения:

1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака; если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (если признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд);

2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака X i и числа единиц совокупности с данным значением признака f i – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака;

3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака X i и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).

Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f . Общая сумма частот вариационного ряда равна объему данной совокупности, т. е.

где k – число групп, n – общее число наблюдений, или объем совокупности.

Частоты (веса) выражают не только абсолютными, но и от­носительными числами – в долях единицы или в процентах от общей численности вариант, составляющих данную совокуп­ность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частностей равна единице

или
,

если частоты выражены в про­центах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необхо­димой в тех случаях, когда приходится сопоставлять друг с дру­гом вариационные ряды, сильно отличающиеся по их объемам.

В зависимости от того, как варьирует признак – дискретно или непрерывно, в широком или узком диапазоне, – статистиче­ская совокупность распределяется в безынтервальный или интер­вальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариаци­онного ряда, во втором – подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от – до), на которые разбивается общая вариация признака в пределах от минималь­ной до максимальной варианты данной совокупности. Эти проме­жутки, или классовые интервалы, могут быть равными и не рав­ными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. В неравноинтервальных рядах характер распределения час­тот меняется по мере изменения ширины классовых интервалов. Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные рас­пределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисле­ние сводных числовых характеристик вариационного ряда, сопо­ставление рядов распределения друг с другом.

Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые интервалы) искажает типичные черты варьи­рования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования.

Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требо­ваниям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построе­нии вариационного ряда:

,

где h – величина интервала; X м a x и X min – максимальное и минимальное значения в совокупности; k – число групп.

При построении интервального ряда распределения необходимо выбирать оптимальное число групп (интервалов признака) и установливать длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Если приходится иметь дело с интервальным рядом распределения с неравными интервалами, то для сопоставимости нужно частоты или частости привести к единице интервала, полученное значение называется плотностью ρ , то есть
.

Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

где n – численность совокупности.

Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Диаграмма такого типа называется гистограммой.

Если имеется дискретный ряд распределения или используются середины интервалов, то графическое изображение такого ряда называется полигоном , которое получается соединением прямыми точек с координатами X i и f i .

Если по оси абсцисс откладывать значения классов, а по оси ординат – накопленные частоты с последующим соединени­ем точек прямыми линиями, получается график, называемый кумулятой. Накопленные частоты находят последо­вательным суммированием, или кумуляцией частот в направлении от первого класса до конца вариационного ряда.

Пример . Имеются данные о яйценоскости 50 кур-несушек за 1 год, содер­жащихся на птицеферме (табл. 1.1).

Т а б л и ц а 1.1

Яйценоскость кур-несушек

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

Требуется построить интервальный ряд распределения и отобразить его графически в виде гистограммы, полигона и кумуляты.

Видно, что признак варь­ирует от 212 до 245 яиц, полученных от несушки за 1 год.

В нашем примере по формуле Стерждесса определим число групп:

k = 1 + 3,322lg 50 = 6,643 ≈ 7.

Рассчитаем длину (размах) интервала по формуле:

.

Построим интервальный ряд с 7 группами и интервалом 5 шт. яиц (табл. 1.2). Для построения графиков в таблице рассчитаем середину интервалов и накопленную частоту.

Т а б л и ц а 1.2

Интервальный ряд распределения яйценоскости

Группа кур-несушек по величине яйценоскости

X i

Число кур-несушек

f i

Середина интервала

Х i ’

Накопленная частота

f i

Построим гистограмму распределения яйценоскости (рис. 1.1).

Р и с. 1.1. Гистограмма распределения яйценоскости

Данные гистограммы показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.

Полигон и кумулята распределения яйценоскости имеют вид (рис. 1.2 и 1.3).

Р и с. 1.2. Полигон распределения яйценоскости

Р и с. 1.3. Кумулята распределения яйценоскости

Технология решения задачи в табличном процессоре Microsoft Excel следующая.

1. Введите исходные данные в соответствии с рис. 1.4.

2. Ранжируйте ряд.

2.1. Выделите ячейки А2:А51.

2.2. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Сортировка по возрастанию > .

3. Определите величину интервала для построения интервального ряд распределения.

3.1. Скопируйте ячейку А2 в ячейку Е53.

3.2. Скопируйте ячейку А51 в ячейку Е54.

3.3. Рассчитайте размах вариации. Для этого введите в ячейку Е55 формулу =E54-E53 .

3.4. Рассчитайте число групп вариации. Для этого введите в ячейку Е56 формулу =1+3,322*LOG10(50) .

3.5. Введите в ячейку Е57 округленное число групп.

3.6. Рассчитайте длину интервала. Для этого введите в ячейку Е58 формулу =E55/E57 .

3.7. Введите в ячейку Е59 округленную длину интервала.

4. Постройте интервальный ряд.

4.1. Скопируйте ячейку Е53 в ячейку В64.

4.2. Введите в ячейку В65 формулу =B64+$E$59 .

4.3. Скопируйте ячейку В65 в ячейки В66:В70.

4.4. Введите в ячейку С64 формулу =B65 .

4.5. Введите в ячейку С65 формулу =C64+$E$59 .

4.6. Скопируйте ячейку С65 в ячейки С66:С70.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.5).

5. Рассчитайте частоту интервалов.

5.1. Выполните команду Сервис , Анализ данных , щелкнув поочередно левой кнопкой мыши.

5.2. В диалоговом окне Анализ данных с помощью левой кнопки мыши установите: Инструменты анализа  <Гистограмма> (рис. 1.6).

5.3. Щелкните левой кнопкой мыши на кнопке <ОК>.

5.4. На вкладке Гистограмма установите параметры в соответствии с рис. 1.7.

5.5. Щелкните левой кнопкой мыши на кнопке <ОК>.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.8).

6. Заполните таблицу «Интервальный ряд распределения».

6.1. Скопируйте ячейки В74:В80 в ячейки D64:D70.

6.2. Рассчитайте сумму частот. Для этого выделите ячейки D64:D70 и щелкните левой кнопкой мыши на панели инструментов на кнопке <Автосумма > .

6.3. Рассчитайте середину интервалов. Для этого введете в ячейку Е64 формулу =(B64+C64)/2 и скопируйте в ячейки Е65:Е70.

6.4. Рассчитайте накопленные частоты. Для этого скопируйте ячейку D64 в ячейку F64. В ячейку F65 введите формулу =F64+D65 и скопируйте в ячейки F66:F70.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.9).

7. Отредактируйте гистограмму.

7.1. Щелкните правой кнопкой мыши на диаграмме на названии «карман» и на появившейся вкладке нажмите кнопку <Очистить>.

7.2. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.

7.3. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки В64:С70 (рис. 1.10).

7.5. Нажмите клавишу .

Результаты выводятся на экран дисплея в следующем виде (рис. 1.11).

8. Постройте полигон распределения яйценоскости.

8.1. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Мастер диаграмм > .

8.2. В диалоговом окне Мастер диаграмм (шаг 1 из 4) с помощью левой кнопки мыши установите: Стандартные  <График> (рис. 1.12).

8.3. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.4. В диалоговом окне Мастер диаграмм (шаг 2 из 4) установите параметры в соответствии с рис. 1.13.

8.5. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.6. В диалоговом окне Мастер диаграмм (шаг 3 из 4) введите названия диаграммы и ос Y (рис. 1.14).

8.7. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.8. В диалоговом окне Мастер диаграмм (шаг 4 из 4) установите параметры в соответствии с рис. 1.15.

8.9. Щелкните левой кнопкой мыши на кнопке <Готово>.

Результаты выводятся на экран дисплея в следующем виде (рис. 1.16).

9. Вставьте на графике подписи данных.

9.1. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.

9.2. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки Е64:Е70 (рис. 1.17).

9.3. Нажмите клавишу .

Результаты выводятся на экран дисплея в следующем виде (рис. 1.18).

Кумулята распределения строится аналогично полигону распределения на основе накопленных частот.

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).