II. Расчетная часть Задание 1 1. Условие Для анализа денежных доходов и расходов на оплату услуг домохозяйств одного из городов центрального округа в отчетном году произведена 0,1%-ная механическая выборка, в результате которой получены следующие данные, тыс. руб.: № домохозяйства п/п В среднем на одного члена домохозяйства
Денежный доход (X) Расходы на оплату услуг (Y)
1 28 4,6
2 27 4,8
3 38 7,0
4 36 6,0
5 30 5,1
6 38 6,8
7 38 6,5
8 45 8,4
9 46 7,8
10 20 3,6
11 46 8,0
12 29 5,0
13 40 6,2
14 48 9,1
15 40 7,2
16 49 9,2
17 40 7,0
18 54 12,4
19 60 14,0
20 51 9,0
21 44 8,0
22 50 10,0
23 44 8,0
24 50 9,0
25 30 5,0
26 33 5,3
27 43 8,2
28 33 5,4
29 35 5,8
30 35 6,0
По данным обследования определить: По исходным данным постройте статистический ряд распределения домохозяйств по признаку - денежный доход в среднем на одного члена домохозяйства, образовав пять групп с равными интервалами. Рассчитайте характеристики интервального ряда распределения: а) среднюю арифметическую; б) среднее квадратическое отклонение; в) коэффициент вариации; г) моду и медиану. Сделайте выводы по результатам выполнения работы. 2. Решение 1. Для построения ряда распределения необходимо определить признак - денежный доход в среднем на одного члена домохозяйства. Для построения группировки домохозяйств с выделением 5 групп найдем величину равного интервала. Величина равного интервала определяется по формуле: , (1) где xmax – максимальное значение признака, xmin – минимальное значение признака, n – число групп. хmax = 60,0 хmin = 20,0
Величина интервала равна 8,0 тыс. руб.. Отсюда путем прибавления величины интервала к минимальному уровню признака в группе получим следующие группы домохозяйств по значению денежного дохода. Таблица 1. Ряд распределения домохозяйств по денежному доходу № группы Группы домохозяйств Число домохозяйств
1 20-28 2
2 28-36 8
3 36-44 8
4 44-52 10
5 52-60 2
Итого 30
Для расчета относительных величин структуры сопоставим число домохозяйств по уровню денежного дохода (Т0) с общим числом домохозяйств (), т.е. определим их удельные весы в процентах: (2) Составим таблицу, отражающую структуру домохозяйств по среднедушевому доходу. Таблица 2. Шаблон выходной таблицы. № группы Денежный доход в среднем на одного члена домохозяйства, тыс. руб. Число домохозяйств Удельный вес домохозяйств, %
1 20-28 2
2 28-36 8
3 36-44 8
4 44-52 10
5 52-60 2
Итого 30
Расчеты произведем вручную. = 2 + 8 + 8 + 10 + 2 = 30 d1 = * 100 = 6,7 % d2 = * 100 = 26,7 % d3 = * 100 = 26,7 % d4 = *100 = 33,2 % d5 = *100 = 6,7 % Таблица 3. Структура домохозяйств по денежному доходу № группы Денежный доход в среднем на одного члена домохозяйства, тыс. руб. Число домохозяйств Удельный вес домохозяйств, %
1 20-28 2 6,7
2 28-36 8 26,7
3 36-44 8 26,7
4 44-52 10 33,2
5 52-60 2 6,7
Итого 30 100
Из Таблицы 3 видно, что больший удельный вес имеют домохозяйства с денежный доход в среднем на одного члена 44-52 тыс. руб. Для расчета данных используем табличный процессор Microsoft Excel пакета Microsoft Office. Таблица 4. Шаблон выходной таблицы. Таблица 5. Итоговая таблица № интервала Денежный доход в среднем на одного члена домохозяйства, тыс. руб. Число домохо-зяйств (fi) Середина интерва-ла (xi) Хi*fi Сумма накопленных частот, S
1 20-28 2 24 48 2
2 28-36 8 32 256 10
3 36-44 8 40 320 18
4 44-52 10 48 480 28
5 52-60 2 56 112 30
Итого
30
1216
Рассчитаем характеристики ряда распределения. Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчете на единицу качественно однородной совокупности. Выбор средней определяется экономическим содержанием показателя и исходных данных. 1. Средняя арифметическая взвешенная определяется по формуле: , где (3) i – среднее значение i-го интервала, fi – частота проявления признака в i-ом интервале. Тогда получим: = 1216,0/30 = 40,533 (тыс. руб.) В среднем, валовой доход на одного члена домохозяйства составил 40,533 тыс. руб. 2. Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности, оно показывает, на сколько, в среднем отклоняются конкретные варианты от их среднего значения. Оно равно корню квадратному из дисперсии. СКО = (4) 3. Дисперсия – это средняя арифметическая из отклонений отдельных вариантов от среднего значения, возведенных в квадрат. Дисперсию вычислим по формуле дисперсии для вариационного ряда: (5) Для расчета данных используем табличный процессор Microsoft Excel пакета Microsoft Office. Таблица 6. Шаблон выходной таблицы. Таблица 7. Итоговая таблица. № интер-вала Денежный доход в среднем на одного члена домохозяйства, тыс. руб. Число домохо-зяйств (fi) Середина интервала (xi) Хi*fi Сумма накопленных частот, S
1 20-28 2 24 48 2 273,340 546,680
2 28-36 8 32 256 10 72,812 582,497
3 36-44 8 40 320 18 0,284 2,273
4 44-52 10 48 480 28 55,756 557,561
5 52-60 2 56 112 30 239,228 478,456
Итого
30 = 40,533 1216
2167,467
Тогда получим: = 2167,467/30= 72,249 Найдем СКО по формуле (4): СКО = = 8,500 (тыс. руб.) На 8,500 тыс. руб. в среднем отклоняются средние значения интервалов денежного дохода домохозяйств от их среднего значения по всей совокупности (40,533 тыс. руб.) 4. Коэффициент вариации. Коэффициент вариации найдем по формуле: % (6) Показатель вариации отражает тенденцию развития явление, т.е. действие главных факторов. Он выражается в процентах. Тогда получим: V = *100 % = 20,9 % Степень однородности совокупности по изучаемому признаку устанавливается по значению коэффициента вариации. Если V? 33 %, то по данному признаку расхождения между значениями признака невелико, единицы наблюдения количественно однородны. Вывод: В среднем величина денежного дохода в среднем на одного члена домохозяйства в месяц составляет 40,533 тыс. руб. с СКО 8,500 тыс. руб. Коэффициент вариации 20,9 % свидетельствует о незначительной колебаемости признака, т.е. единицы наблюдения количественно однородны. 5. Мода – это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.е. это вариант, имеющий наибольшую частоту. Расчет моды произведем по формуле для интервального ряда распределения с равными интервалам: , (7) где - нижняя граница модального интервала. - величина модального интервала. - частоты модального интервала, предшествующего и следующего за ним. В данном случае модальным является интервал (44-52) с наибольшей частотой – 10. Определим для этого интервала моду: М0 = 44,0 + 8,0 * = 45,6 (тыс. руб.) Также мода может быть найдена графическим методом. Для этого построим гистограмму. Нахождение моды отразим на графике – рисунок 2. Рис.2. Графическое нахождение моды. М0 = 45,6 (тыс. руб.) Это означает, что среди заданной выборки наиболее часто встречаются домохозяйства, имеющие доход 45,6 (тыс. руб.). 6. Медиана – это величина варианта, находящегося в середине ряда распределения. Определим медиану с помощью формулы линейной интерполяции: , где (8) - нижняя граница медианного интервала. В нашем случае медианным является интервал (36-44). - величина медианного интервала. - сумма накопленных частот (рассчитана в таблице 7), предшествующих медианному интервалу. - частота медианного интервала. Ме = 36,0 + 8,0 * = 41 тыс. руб. Из расчетов видно, что половина домохозяйств имеет денежный доход на одного члена домохозяйства до 41 тыс. руб., половина выше этой суммы. Определим графически значение медианы – по кумуляте. Нахождение представлено на Рисунке 3.
Рис.3. Графическое нахождение медианы. Задание 2 1. Условие По исходным данным: а) установить наличие и характер связи между признаками – денежный доход и расход на оплату услуг в среднем на одного члена домохозяйства методом аналитической группировки, образовав пять групп с равными интервалами по