Практическая часть Имеются следующие выборочные данные (выборка 25%-ная механическая) о доходах и расходах бюджетов субъектов РФ за полугодие, млн.руб. Таблица 1 – Исходные данные Номер региона п/п Доходы бюджета Расходы бюджета Номер региона п/п Доходы бюджета Расходы бюджета
1 4,2 5,4 16 1,2 3,1
2 3,8 5,2 17 3,6 4,5
3 6,4 8,7 18 2,2 3,8
4 2,1 3,2 19 0,9 1,9
5 2,4 4,6 20 2,3 3,1
6 2,0 3,5 21 3,5 4,6
7 0,7 2,0 22 4,4 6,2
8 3,9 5,0 23 4,8 7,2
9 8,0 7,4 24 7,5 8,0
10 4,2 6,0 25 0,8 1,7
11 2,5 4,6 26 3,5 4,7
12 3,9 4,9 27 4,1 6,5
13 7,6 8,6 28 6,3 8,6
14 4,1 5,8 29 5,3 6,8
15 0,5 1,8 30 5,2 7,1
Задание 1 По исходным данным (табл. 1) необходимо выполнить следующее: Построить статистический ряд распределения регионов по признаку доходы бюджета, образовав пять групп с равными интервалами. Графическим методом и путем расчётов определить значения моды и медианы полученного ряда распределения. Рассчитать характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации. Вычислить среднюю арифметическую по исходным данным (табл. 1), сравнить её с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объяснить причину их расхождения. Сделать выводы по результатам выполнения Задания 1. Выполнение Задания 1 Целью выполнения данного Задания является изучение состава и структуры выборочной совокупности регионов путем построения и анализа статистического ряда распределения регионов по признаку Доходы бюджетов. Для построения интервального вариационного ряда, характеризующего распределение регионов по доходам бюджетов, необходимо вычислить величину и границы интервалов ряда. При построении ряда с равными интервалами величина интервала h определяется по формуле , (1) где – наибольшее и наименьшее значения признака в исследуемой совокупности, k- число групп интервального ряда. Подставим в данную формулу исходные данные: млн. руб. При h = 1,5 млн. руб. границы интервалов ряда распределения имеют следующий вид (табл. 2): Таблица 2 Номер группы Нижняя граница, млн. руб. Верхняя граница, млн. руб.
1 0,5 2,0
2 2 3,5
3 3,5 5,0
4 5 6,5
5 6,5 8,0
Процесс группировки единиц совокупности по признаку Доходы бюджета представлен во вспомогательной (разработочной) таблице 3 (графа 4 этой таблицы необходима для построения аналитической группировки в Задании 2). Таблица 3 – Разработочная таблица для построения интервального ряда распределения и аналитической группировки Группы регионов по доходам бюджета, млн. руб. Номер региона Доходы бюджета Расходы бюджета
1 2 3 4
0,5 - 2,0 15 0,5 1,8
7 0,7 2
25 0,8 1,7
19 0,9 1,9
16 1,2 3,1
Всего 82 4,1 10,5
2,0 - 3,5 6 2 3,5
4 2,1 3,2
18 2,2 3,8
20 2,3 3,1
5 2,4 4,6
11 2,5 4,6
Всего 64 13,5 22,8
3,5 - 5,0 21 3,5 4,6
26 3,5 4,7
17 3,6 4,5
2 3,8 5,2
8 3,9 5
12 3,9 4,9
14 4,1 5,8
27 4,1 6,5
1 4,2 5,4
10 4,2 6
22 4,4 6,2
23 4,8 7,2
Всего 183 48 66
5,0 - 6,5 30 5,2 7,1
29 5,3 6,8
28 6,3 8,6
3 6,4 8,7
Всего 90 23,2 31,2
6,5 - 8,0 24 7,5 8
13 7,6 8,6
9 8 7,4
Всего 46 23,1 24
ИТОГО 465 111,9 154,5
На основе групповых итоговых строк «Всего» табл. 3 сформируем итоговую таблицу 4, представляющая интервальный ряд распределения банков по доходам бюджета. Таблица 4 – Распределение регионов по доходам бюджета Номер группы Группы регионов по доходам бюджета, млн. руб. Число регионов в абсолютном выражении Число регионов в относительном выражении Накопленная частота Накопленная частость, %
1 0,5 - 2,0 5 16,67 5 16,67
2 2,0 - 3,5 6 20,00 11 36,67
3 3,5 - 5,0 12 40,00 23 76,67
4 5,0 - 6,5 4 13,33 27 90,00
5 6,5 - 8,0 3 10,00 30 100,00
Итого
30 100,00
Вывод. Анализ интервального ряда распределения изучаемой совокупности регионов показывает, что распределение регионов по доходам бюджета не является равномерным: преобладают регионы с доходами бюджета от 3,5 млн. руб. до 5,0 млн. руб. (это 12 регионов, доля которых составляет 40%); 36,67% регионов имеют доходы бюджета менее 3,5 млн. руб., а 90% – менее 6,5 млн. руб. Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1). Гистограмма распределения регионов по доходам бюджета
Рис. 1 Определение моды графическим методом Конкретное значение моды для интервального ряда рассчитаем по формуле: (2) где хМo – нижняя граница модального интервала, h –величина модального интервала, fMo – частота модального интервала, fMo-1 – частота интервала, предшествующего модальному, fMo+1 – частота интервала, следующего за модальным. Согласно табл. 3 модальным интервалом построенного ряда является интервал 3,5 – 5,0 млн. руб., так как его частота максимальна (f = 12). Расчет моды по формуле (2):
Вывод. Для рассматриваемой совокупности регионов наиболее распространенный доход бюджета характеризуется средней величиной 4,14 млн. руб. Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности. Определим медиану графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам.
Рис. 2 Определение медианы графическим методом Конкретное значение медианы для интервального ряда рассчитаем по формуле: , (3) где хМе– нижняя граница медианного интервала, h – величина медианного интервала, – сумма всех частот, fМе – частота медианного интервала, SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному. Найдем медианный интервал. Таким интервалом будет интервал доходов бюджета регионов (3,5-5,0 млн. руб.), поскольку его накопленная частота равная 23, впервые превышает величину, равную половине численности единиц (30:2=15). Расчет значения медианы по формуле (3):
Вывод. В рассматриваемой совокупности регионов половина регионов имеют в среднем доходы не более 4,0 млн. руб., а другая половина – не менее 4,0 млн. руб. Для расчета характеристик ряда распределения , ?, ?2, V? на основе построим вспомогательную таблицу 5 ( – середина j-го интервала). Таблица 5 – Расчетная таблица для нахождения характеристик ряда распределения Группы регионов по доходам бюджета, млн. руб. Середина интервала Число регионов fj
1 2 3 4 5 6 7
0,5 - 2,0 1,25 5 6,25 -2,7 7,29 36,45
2,0 - 3,5 2,75 6 16,5 -1,2 1,44 8,64
3,5 - 5,0 4,25 12 51 0,3 0,09 1,08
5,0 - 6,5 5,75 4 23 1,8 3,24 12,96
6,5 - 8,0 7,25 3 21,75 3,3 10,89 32,67
Итого
30 118,5
91,8
Рассчитаем среднюю арифметическую взвешенную: (4) Расчет среднего квадратического отклонения: (5) Расчет дисперсии: ?2 =1,7492=3,06 Расчет коэффициента вариации: (6) Вывод. Значение V? = 44,29% превышает 33%, следовательно, вариация доходов бюджетов в исследуемой совокупности регионов значительна и совокупность по данному признаку качественно неоднородна. Средняя величина плохо представляет всю совокупность, является нетипичной, ненадежной. Для расчета средней арифметической по исходным данным применяется формула средней арифметической простой: (7) Причина расхождения средних величин, рассчитанных по формулам (7) и (4), заключается в том, что по формуле (7) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти банков, а по формуле (4) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы). Задание 2 По исходным данным табл. 1 с использованием результатов выполнения Задания 1 необходимо выполнить следующее: Установить наличие и характер корреляционной связи между признаками Доходы бюджета и Расходы бюджета, образовав по каждому признаку пять групп с равными интервалами, используя методы: а) аналитической группировки; б) корреляционной таблицы. Оценить тесноту корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение. Сделать выводы по результатам выполнения Задания 2. Выполнение Задания 2 Целью выполнения данного Задания является выявление наличия корреляционной связи межд