Задача 1
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (, млн. руб.) от объема капиталовложений (, млн. руб.)

36
28
43
52
51
54
25
37
51
29


85
60
99
117
118
125
56
86
115
68


Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью - критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения.
Представить графически: фактические и модельные значения точки прогноза.
Составить уравнения нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение:
1) Сначала, для удобства решения, отсортируем все x и y в порядке возрастания (табл.1)
x
25
28
29
36
37
43
51
51
52
54

y
56
60
68
85
86
99
115
118
117
125

Табл.1.
Для расчёта параметров уравнения линейной регрессии, воспользуемся инструментом анализа данных Регрессия. Для этого в главном меню выбираем Сервис/Анализ данных/ Регрессия. Заполняем диалоговое окно ввода данных и параметров вывода (рис.2)

Рис.2. Диалоговое окно ввода параметров инструмента Регрессия.
Результаты регрессионного анализа для данных представлены на рис.3.

Рис.3.Результаты применения инструмента Регрессия
Таким образом, получено уравнение регрессии y=-1+2.32x
Экономическая интерпретация коэффициента регрессии заключается в том, что если объёмы капиталовложений возрастут на 1 млн., то объём выпуска продукции возрастёт на 2,32 млн.руб.
2) Вычислим остатки, найдём остаточную сумму квадратов (рис.4) и построим график остатков (рис.5)
№ п/п
x
y
ypi
ei
ei2

1
25
56
56,807
-0,807
0,651

2
28
60
63,748
-3,748
14,045

3
29
68
66,061
1,939
3,758

4
36
85
82,257
2,743
7,524

5
37
86
84,571
1,429
2,043

6
43
99
98,453
0,547
0,299

7
51
115
116,962
-1,962
3,850

8
51
118
116,962
1,038
1,077

9
52
117
119,276
-2,276
5,180

10
54
125
123,903
1,097
1,203

Рис.4.

Рис.5.
По графику остатков можно сказать о гомоскедастичности остаточной компоненты, подтверждать эти данные будем аналитическим исследованием.
3) Проверим выполнение предпосылок МНК, то есть остаточная компонента должна удовлетворять четырём требованиям:
1) Математическое ожидание остаточной компоненты равно нулю
М(е)=0
2) Последовательные уровни должны быть некоррелируемы
r(ei;еi+1)=0
3) Дисперсия остатков должна быть гомоскедастичной
D(e)=0
4) Ряд значений остаточной компоненты должен соответствовать нормальному закону распределения.
Математическое ожидание остаточной компоненты равно нулю, так как значит первое требование выполнено. Независимость последовательных уровней остаточной компоненты проверяется с помощью критерия Дарбина-Уотсона. Для этого вычисляется dрасч.
dрасч=, произведем необходимые расчёты (рис.6)

№ п/п
x
y
ypi
ei
ei^2
еi-ei-1
(еi-ei-1)2

1
25
56
56,807
-0,807
0,651
 
 

2
28
60
63,748
-3,748
14,045
-2,941
8,650

3
29
68
66,061
1,939
3,758
5,686
32,334

4
36
85
82,257
2,743
7,524
0,804
0,647

5
37
86
84,571
1,429
2,043
-1,314
1,726

6
43
99
98,453
0,547
0,299
-0,882
0,778

7
51
115
116,962
-1,962
3,850
-2,509
6,297

8
51
118
116,962
1,038
1,077
3,000
9,000

9
52
117
119,276
-2,276
5,180
-3,314
10,980

10
54
125
123,903
1,097
1,203
3,373
11,375

Итого:
 
 
 
 
39,630
 
81,787

Рис.6.
dрасч==2,064 dрасч>2переходим к d dрасч=4-dрасч=4-2,064=1,936
1,936последовательные уровни остаточной компоненты независимы, значит второе требование выполнено.

Для применения МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора хj остатки (i имеют одинаковую дисперсию. Если это условие не соблюдается, то имеет место гетероскедастичность. Чтобы проверить это мы исключим из рассмотрения с центральных наблюдений; при этом (п-с):2>p, где р – число оцениваемых параметров. Разделим совокупность из (п-с) наблюдений на две группы (соответственно с малыми и с большими значениями фактора х) и определим по каждой из групп уравнение регрессии. Определим остаточную сумму квадратов для первой (S1) и второй (S2) групп и найдем их отношения: Fрасч=S1:S2. При выполнении гипотезы о гомоскедастичности отношение Fрасч будет удовлетворять F-критерию со степенями свободы ((п-с-2р):2) для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.
В нашем случае п=10, с=2, р=2, выделим 2 центральных наблюдения из всей совокупности и рассчитаем уравнение регрессии для каждой из двух оставшихся групп с помощью инструмента Регрессия, а их остатки запишем в соответствующую графу. (рис.7)
№ п/п
x
y
ypi
ei
ei^2
Еi

1
25
56
56,807
-0,807
0,651
0,969

2
28
60
63,748
-3,748
14,045
-3,177

3
29
68
66,061
1,939
3,758
2,108

4
36
85
82,257
2,743
7,524
0,100

5
37
86
84,571
1,429
2,043
 

6
43
99
98,453
0,547
0,299
 

7
51
115
116,962
-1,962
3,850
-0,917

8
51
118
116,962
1,038
1,077
2,083

9
52
117
119,276
-2,276
5,180
-1,750

10
54
125
123,903
1,097
1,203
0,583

Итого:
 
 
 
 
39,630
 

Рис.7
Возведём в квадрат остаточные компоненты каждой группы и подсчитаем сумму каждой из них (рис.8)
№ п/п
x
y
ypi
ei
ei^2
Еi
Ei^2

1
25
56
56,807
-0,807
0,651
0,969
0,939

2
28
60
63,748
-3,748
14,045
-3,177
10,093

3
29
68
66,061
1,939
3,758
2,108
4,442

4
36
85
82,257
2,743
7,524
0,100
0,010

5
37
86
84,571
1,429
2,043
 
15,485

6
43
99
98,453
0,547
0,299
 


7
51
115
116,962
-1,962
3,850
-0,917
0,840

8
51
118
116,962
1,038
1,077
2,083
4,340

9
52
117
119,276
-2,276
5,180
-1,750
3,062

10
54
125
123,903
1,097
1,203
0,583
0,340

Итого:
 
 
 
 
39,630
 
8,583

Рис.8
Затем большую сумму поделим на меньшую, таким образом найдём Fрасч
Fрасч=15,485/8,583=1,804. Fтабл находим на уровне значимости 0,05 со степенями свободы ((п-с-2р):2). Таким образом Fкрит=F0.05;2;2=19,00
Fрасч<Fкрит> остатки гомоскедастичны, это значит что третье требование выполнено.

Чтобы проверить соответствие ряда значений остаточной компоненты нормальному закону распределения, нужно подсчитать R/Sрасч.
R/Sрасч=, где S(=
S(== 2.23 R/Sрасч==2,91
Так как R/Sрасч (2,7;3,7), то остаточная компонента распределена по нормальному закону и значит четвёртое требование выполнено.
Все предпосылки МНК выполнены.
4) Чтобы осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента, нужно сравнить tрасч и tкрит. Значение tкрит зависит от принятого уровня значимости (в данном случае (=0,05) и от числа степеней свободы (п-р-1), где п-число единиц совокупности, р-число факторов.
В нашем случае tрасч a0=-0.37, а tкрит=t0.05;7=2,3646, так как tрасч<tкрит, то коэффициент a0 является статистически незначимым, tрасч а1=34,515>tкрит, поэтому коэффициент а1 является статистически значимым, надёжным, на него можно опираться в анализе и прогнозе.
5) Чтобы вычислить коэффициент детерминации воспользуемся формулой: . Для этого произведём необходимые расчёты (рис.9)
№ п/п
x
y
 
 

1
25
56
243,36
1361,61

2
28
60
158,76
1082,41

3
29
68
134,56
620,01

4
36
85
21,16
62,41

5
37
86
12,96
47,61

6
43
99
5,76
37,21

7
51
115
108,16
488,41

8
51
118
108,16
630,01

9
52
117
129,96
580,81

10
54
125
179,56
1030,41

Итого:
406
929
1102,4
5940,9

среднее
40,6
92,9
-
-







((
122,48
660,08
-
-

Рис.9
(x2= (y2=
Исходя из этого найдём коэффициент детерминации: 0,99
Это означает, что 99% вариации объёма выпуска продукции (у) объясняется вариацией фактора х – объёмом капиталовложений.
Проверка значимости уравнения регрессии с помощью F-крите