ЗАДАЧА № 2
По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли Y от среднегодовой ставки по кредитам Х1, ставки по депозитам Х2 и размера внутрибанковских расходов Х3.
36
28
66
74
80
84
82
98
112
96
Y

40
44
28
52
50
64
70
68
78
90
X1

32
40
44
28
50
56
50
56
60
62
X2

60
68
80
76
44
96
100
104
106
98
X3


1. Осуществить выбор факторных признаков для построения двухфакторной модели
2. Рассчитать параметры модели
3. Для характеристики модели определить
а) линейный коэффициент множественной корреляции
б) коэффициент детерминации
в)средние коэффициенты эластичности
г)бета, дельта - коэффициенты.
Дать их интерпретацию
4. Оценить надежность уравнения регрессии
5. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии
6. Построить точечный и интервальный прогнозы результативного показателя
7. Отразить результаты прогнозов на графике
РЕШЕНИЕ:
Исходные данные сведены в табл. 1
Таблица 1. Статистические данные по переменным
Y
X1
X2
Х3


36
40
32
60


28
44
40
68


66
28
44
80


74
52
28
76


80
50
50
44


84
64
56
96


82
70
50
100


98
68
56
104


112
78
60
106


96
90
62
98

Сумма
756
584
478
832

Среднее
75,6
58,4
47,8
83,2

Количество наблюдений n равно
10


1.Вычисление матрицы коэффициентов парной корреляции и анализ тесноты связи между показателями
Коэффициент парной корреляции определяется по формуле 1:
Вычислим матрицу коэффициентов парной корреляции
Таблица 2. Расчет величин, входящих в формулу 1 для расчета коэффициентов парной корреляции
Y(t)-Ycp
X1(t)-X1cp
X2(t)-X2cp
X3(t)-X3cp
Y(t)-Ycp
X1(t)-X1cp
X2(t)-X2cp
X3(t)-X3cp



 
 

 
в квадр.
в квадр.
в квадр.
в квадр.



1
2
3
4
5
6
7
 



-39,6
-18,4
-15,8
-23,2
1568,16
338,56
249,64
538,24



-47,6
-14,4
-7,8
-15,2
2265,76
207,36
60,84
231,04



-9,6
-30,4
-3,8
-3,2
92,16
924,16
14,44
10,24
0,7486
r1

-1,6
-6,4
-19,8
-7,2
2,56
40,96
392,04
51,84
0,7510
r2

4,4
-8,4
2,2
-39,2
19,36
70,56
4,84
1536,64



8,4
5,6
8,2
12,8
70,56
31,36
67,24
163,84



6,4
11,6
2,2
16,8
40,96
134,56
4,84
282,24



22,4
9,6
8,2
20,8
501,76
92,16
67,24
432,64



36,4
19,6
12,2
22,8
1324,96
384,16
148,84
519,84



20,4
31,6
14,2
14,8
416,16
998,56
201,64
219,04





Сумма

6302,4
3222,4
1211,6
3985,6





Корень

79,39
56,77
34,81
63,13



(Y(t)-Ycp)*
(Y(t)-Ycp)*
(Y(t)-Ycp)*
(X1(t)-X1cp)*
(X1(t)-X1cp)*
(X2(t)-X2cp)*





(X1(t)-X1cp)
(X2(t)-X2cp)
(X3(t)-X3cp)
(X2(t)-X2cp)
(X3(t)-X3cp)
(X3(t)-X3cp)





8
9
10
11
12
13





728,64
625,68
918,72
290,72
426,88
366,56





685,44
371,28
723,52
112,32
218,88
118,56





291,84
36,48
30,72
115,52
97,28
12,16





10,24
31,68
11,52
126,72
46,08
142,56





-36,96
9,68
-172,48
-18,48
329,28
-86,24





47,04
68,88
107,52
45,92
71,68
104,96





74,24
14,08
107,52
25,52
194,88
36,96





215,04
183,68
465,92
78,72
199,68
170,56





713,44
444,08
829,92
239,12
446,88
278,16





644,64
289,68
301,92
448,72
467,68
210,16





3373,6
2075,2
3324,8
1464,8
2499,2
1354,4






Таблица 3. Матрица коэффициентов парной корреляции
 
Y
X1
X2
X3
 
Y
X1
X2
X3

Y
1
 
 
 
Y
1
 
 
 

X1
0,749
1
 
 
X1
0,749
1
 
 

X2
0,751
0,741
1
 
X2
0,751
0,741
1
 

X3
0,663
0,697
0,616
1
X3
0,663
0,697
0,616
1


Значимость коэффициентов корреляции проверяем по t-критерию Стьюдента, для этого рассчитываем tнабл по формуле
Рассчитанные значения tнабл сведены в табл. 4
Таблица 4. Рассчитанные значения tнабл
Сравниваем абсолютные значения tнабл с табличными значениями распределения Стьюдента tkp для надежности 90% и степени свобода n-2. Табличное значение tkp=1,86
Если tнабл>tkp , то полученное значение коэффициента корреляции признается значимым
Таблица 4. Результаты расчета tнабл и выводы о значимости коэффициентов корреляции
Наблюдаемые значения tнабл

Значимость коэффициента

 
Y
X1
X2
X3
 
Y
X1
X2
X3

Y
 
 
 
 
Y
-
 
 
 

X1
3,194
 
 
 
X1
значим
-
 
 

X2
3,217
3,124
 
 
X2
значим
значим
-
 

X3
2,508
2,752
2,214
 
X3
значим
значим
значим
-


Проверяем условие мультиколлинеарности: rxi,xk<0.8; ry,xi>rxi,xk. Если хотя бы одно из этих неравенств не выполняется, то в модель включаются факторы, которые наиболее тесно связаны с Y.
Факторы
X1
X2
X3




Выполнение условия: rxi,xk<0.8; ry,xi>rxi,xk
 
1
1
0
+1 если выполнено условие

Общая оценка фактора
1,749
1,751
0,663





Строим двухфакторную модель. Вводим новые обозначения факторов. Фактор Х0 равен 1 для всех t
Обозначим через Х1 фактор с наибольшей общей оценкой. В исходном условии это фактор X2
Обозначим через Х2 фактор со второй по величине оценкой. В исходном условии это фактор X1
В результате получим матрицы Y и Х, где матрица Х имеет 3 столбца (Х0,Х1 и Х2) и 10 строк.
2. Построение линейной модели регрессии Y(i)=a(0)*Х0+a(1)*X1(i)+a(2)*X2(i)
Таблица 5. Матрицы,полученные после отбора ведущих фактора и использованные для построения модели




Матрица

Матрица Х (10х3)

Y(10х1)
X0
X1
X2

Y (10х1)

X(0)
X1
X2

36
1
32
40

36

1
32
40

28
1
40
44

28

1
40
44

66
1
44
28

66

1
44
28

74
1
28
52

74

1
28
52

80
1
50
50

80

1
50
50

84
1
56
64

84

1
56
64

82
1
50
70

82

1
50
70

98
1
56
68

98

1
56
68

112
1
60
78

112

1
60
78

96
1
62
90

96

1
62
90

756
10
478
584
Сумма






75,6
1
47,8
58,4
Среднее

Искомая










матрица










а






а = (ХТХ)-1ХТY


а(0)










а(1)










а(2)





Транспонированная матрица ХТ





1
1
1
1
1
1
1
1
1
1

32
40
44
28
50
56
50
56
60
62

40
44
28
52
50
64
70
68
78
90

1
1
1
1
1
1
1
1
1
1

32
40
44
28
50
56
50
56
60
62

40
44
28
52
50
64
70
68
78
90


Матрица (ХТХ)

Матрица (ХТХ)-1


10
478
584

1,986061
-0,038943
-0,000421

478
24060
29380

-0,03894
0,0018323
-0,000833

584
29380
37328

-0,00042
-0,000833
0,0006889

10
478
584

1,986061
-0,038943
-0,000421

478
24060
29380

-0,03894
0,0018323
-0,000833

584
29380
37328

-0,00042
-0,000833
0,0006889


Матрица (ХТХ)-1ХТ







0,723
0,4098
0,260776
0,873769
0,017859
-0,221691
0,0094438
-0,223374
-0,383355
-0,46629

-0,01
-0,0023
0,018358
-0,03095
0,011028
0,0103608
-0,005631
0,007029
0,0060292
-0,0003

5E-04
-0,0034
-0,01778
0,012083
-0,00762
-0,002972
0,0061594
-0,000216
0,0033417
0,009943

0,723
0,4098
0,260776
0,873769
0,017859
-0,221691
0,0094438
-0,223374
-0,383355
-0,46629

-0,01
-0,0023
0,018358
-0,03095
0,011028
0,0103608
-0,005631
0,007029
0,0060292
-0,0003

5E-04
-0,0034
-0,01778
0,012083
-0,00762
-0,002972
0,0061594
-0,000216
0,0033417
0,009943


а= (ХТХ)-1ХТY








а(0)
-6,6346

Уравнение регрессии





а(1)
0,9925

Yp(i)=a(0)+a(1)*X1(i)+a(2)*X2(i)





а(2)
0,5958

c учетом найденных коэффициентов уравнения регрессии а(0), а(1) и а(2)

уравнение регрессии имеет вид
Yp(i)=-6,6346+0,9925*X1(i)+0,5958*X2(i)


3. Оценка качества построенной модели
Таблица 6. Промежуточные расчеты для оценки адекватности модели
t
Факт
Yp(t)
Отклон
Точки
Откл, по
|E(t)|/Y(t)
E(t)2
[Y(t)-Ycp]2

 
Y(t)
расчет
E(t)
поворота
модулю
%

 

1
2
3
4
5
6
7
8
9

1
36
49,0
-12,96
хххх
12,96
35,99
167,87
1 568,16

2
28
59,3
-31,28
1
31,28
111,71
978,41
2 265,76

3
66
53,7
12,28
0
12,28
18,61
150,86
92,16

4
74
52,1
21,86
1
21,86
29,55
478,07
2,56

5
80
72,8
7,22
0
7,22
9,03
52,14
19,36

6
84
87,1
-3,07
1
3,07
3,66
9,46
70,56

7
82
84,7
-2,69
0
2,69
3,29
7,26
40,96

8
98
89,5
8,54
0
8,54
8,72
72,97
501,76

9
112
99,4
12,61
1
12,61
11,26
159,12
1 324,96

10
96
108,5
-12,52
*****
12,52
13,04
156,74
416,16

55
756
756,0
0,00
4
125,05
244,85
2 232,89
6 302,40

Ycp =756 / 10 = 75,6
Таблицы 6. Продолжение
E(t-1)
E(t)-E(t-1)
графа 11 в
E(t)*E(t-1)

 

квадрате


10
11
12
13

-
-
-
-

-12,96
-18,32
335,74
405,27

-31,28
43,56
1 897,64
-384,19

12,28
9,58
91,82
268,55

21,86
-14,64
214,45
157,88

7,22
-10,30
106,00
-22,20

-3,07
0,38
0,14
8,28

-2,69
11,24
126,26
-23,01

8,54
4,07
16,58
107,75

12,61
-25,13
631,72
-157,93


0,44
3 420,36
360,40

3.1.Проверка случайности уровней на основе критерия поворотных точек
Проверку случайности уровней остаточной компоненты (столбец 4 табл.6.) проводим на основе критерия поворотных точек. Для этого каждый уровень ряда сравниваем с двумя соседними. Если он больше (либо меньше) обеих соседних уровней , то он является поворотной точкой и тогда в столбце 4 рядом с ним ставим 1. В первой и последней строку ставим прочерки, т.к. у этих уровней нет двух соседних уровней . Общее число поворотных точек равно 4
Оно приведено в последней строке 5-го столбца таблицы 6. Обозначим его через р
Рассчитаем q = ЦЕЛОЕ{ 2 *(N-2)/3 - 2*КОРЕНЬ[(16*N - 29)/90] } = ЦЕЛОЕ{2,929495 } = 2
Суть критерия состоит в том, что если p>q, то условие случайности уровней выполнено.
Поскольку неравенство
p>q
есть
ИСТИНА
то на вопрос



СВОЙСТВО СЛУЧАЙНОСТИ ВЫПОЛНЕНО?
ОТВЕЧАЕМ :
ДА

 


3.2. Проверка НЕЗАВИСИМОСТИ (ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ)
Проверку проводим двумя методами
а) по d-критерию Дарбина-Уотсона ;
б) по первому коэффициенту автокорреляции r(1).
Проверка по d-критерию Дарбина-Уотсона
Для проверки по d-критерию Дарбина-Уотсона рассчитали значение d и если пол