Задача
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн руб.) от объема капиталовложений (Х, млн руб.).
Х
12
4
18
27
26
29
1
13
26
5

Y
21
10
26
33
34
37
9
21
32
14


Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (?=0,05).
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (?=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя Y при уровне значимости ?=0,1, если прогнозное значение фактора Х составит 80% от его максимального значения.
Представить графически фактические и модельные значения Y точки прогноза.
Составить уравнения нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение
Расчет параметров уравнения линейной регрессии проводится с помощью инструмента анализа данных в Excel. Однако мы видим, что сначала необходимо отсортировать исходные данные по возрастанию переменной Х, так как в задании присутствует необходимость проверки предпосылок МНК.
Выполним сортировку: Данные – Сортировка – По переменной Х – По возрастанию:

Получим:

Далее выполним: Анализ данных – Регрессия:

Далее введем входные интервалы для Х и Y, поставим галочку на Метки, осуществим запрос на остатки и график остатков:

ВЫВОД ИТОГОВ






Регрессионная статистика


Множественный R
0,994048


R-квадрат
0,988132


Нормированный R-квадрат
0,986649


Стандартная ошибка
1,190935


Наблюдения
10


Дисперсионный анализ





 
df
SS
MS
F
Значимость F


Регрессия
1
944,7534
944,7534
666,1041
5,45E-09


Остаток
8
11,34662
1,418327




Итого
9
956,1
 
 
 


 
Коэффициенты
Стандартная ошибка
t-статистика
P-Значение
Нижние 95%
Верхние 95%
Нижние 95,0%
Верхние 95,0%


Y-пересечение
8,12023
0,711501
11,41281
3,14E-06
6,479505
9,760955
6,479505
9,760955


X
0,967688
0,037494
25,80899
5,45E-09
0,881226
1,054149
0,881226
1,054149


Результат регрессионного анализа имеет вид:
ВЫВОД ОСТАТКА





Наблюдение
Предсказанное Y
Остатки

1
9,087918
-0,08792

2
11,99098
-1,99098

3
12,95867
1,041332

4
19,73248
1,267519

5
20,70017
0,299831

6
25,53861
0,461394

7
33,28011
0,719893

8
33,28011
-1,28011

9
34,24779
-1,24779

10
36,18317
0,81683







Таким образом, исходя из коэффициентов, получаем уравнение зависимости объема выпуска продукции от объема капиталовложений:
Y=8,12+0,97Х.
С увеличением объема капиталовложений на 1 млн руб. объем выпускаемой продукции увеличится в среднем на 970 тыс. руб.
Остатки получены по итогам регрессии:
Остатки

-0,08792

-1,99098

1,041332

1,267519

0,299831

0,461394

0,719893

-1,28011

-1,24779

0,81683


Остаточная сумма квадратов равна 11,35 (столбец SS остатка в табл. «Дисперсионный анализ»).
Дисперсия остатков S?2=1,42 (столбец MS остатка в табл. «Дисперсионный анализ).
График остатков ранее уже был получен. Для удобства преобразуем его в точечную диаграмму, соединив точки:

1) Проверим выполнение свойства случайности остатков построенной модели зависимости объемов выпуска продукции от объема капиталовложений. Проверку осуществим с помощью критерия поворотных точек. По графику остатков видно, что количество поворотов p=5. При n=10,
pкр= – 1,96={2,9}=2.
P=5>pкр=2, следовательно, свойство случайности для ряда остатков выполняется.
2) Свойство нулевого математического ожидания для линейной модели выполняется автоматически.
3) Проверим выполнение свойства постоянной дисперсии остаточной компоненты с помощью критерия Голдфельда – Квандта. Возьмем первые и последние четыре уровня, средние два уровня не рассматриваем. С помощью функции Регрессия построим модели по первым и последним четырем наблюдениям:

Итоги регрессии для первых четырех наблюдений:

Итоги регрессии для последних четырех наблюдений:

Для первой модели SS1=4,75; для второй модели SS2=3,33.
F= ==1,43.
Критическое значение Fкр при ?=5% и числах степеней свободы
k1=k2=4-1-1=2 найдем с помощью функции FРАСПОБР:

Получили, что Fкр=19.
F=1,43<Fкр=19, следовательно, свойство постоянной дисперсии остаточной компоненты выполняется, модель гомоскедастичная.
4) Проверим выполнение свойства независимости остатков, используя критерий Дарбина – Уотсона.
Вычислим d-статистику с помощью функций СУММКВ и СУММКВРАЗН:






СУММКВРАЗН(Е)=

22,16079



СУММКВ(Е)=
11,34662



d=

1,953075








Определим критические уровни d1 и d2 при n=10 по таблице. Получим, d1=0,88 и d2=1,32. Таким образом, d больше верхнего критического уровня и меньше 2, а это говорит о том, что свойство независимости остаточной компоненты выполняется.
5) Проверим выполнение свойства нормального распределения остатков, используя R/S критерий.
R/S== 2,736084.

Критический интервал при n=10 и ?=5% будет (2,67;3,57).
2,74Є(2,67;3,57), следовательно, свойство нормального распределения остатков для построенной модели выполняется.
Проведенная проверка предпосылок регрессионного анализа показала, что для модели выполняются все условия Гаусса – Маркова. Таким образом, МНК – наилучший метод моделирования.
Выпишем из Регрессии t-статистику для коэффициентов модели:
а=8,12; t(a)=11,41
b=0,97; t(b)=25,81 (столбец « t-статистик» Регрессии).
Определим tкр с помощью функции СТЬЮДРАСПОБР(5%; 8):
tкр=2,31.
Сравним |t(a)|=11,41>tкр=2,31, следовательно, свободный коэффициент является значимым, его необходимо сохранить в модели.
|t(b)|=25,81>tкр=2,31, следовательно, коэффициент регрессии b является значимым, его и фактор объема капиталовложений нужно также сохранить в модели.

Оба коэффициента являются значимыми и необходимыми в данной модели.
Выпишем из Регрессии R2=0,99=99%.
Таким образом, вариация объема выпуска продукции Y на 99% объясняется по полученному уравнению вариацией объема капиталовложений.
Оценим значимость уравнения с помощью F-критерия Фишера.
Выпишем из Регрессии F=666,1.
Fкр=5,32, найдем с помощью функции FРАСПОБР(5%; k1=1; k2=8):

Сравним F=666,1>Fкр=5,32, следовательно, уравнение модели является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель факторной переменной X.
Найдем теперь среднюю относительную ошибку аппроксимации. Для этого используем исходные значения Yi и найденные Регрессией остатки Ei. Вычислим относительные погрешности: Еотн=||*100%:

С помощью СРЗНАЧ найдем Еотн=4,97%.
Сравним Еотн=4,97%Є(0; 5%), следовательно, модель является достаточно точной, однако точность модели приближена к удовлетворительной.
Вывод: в результате исследования получилось, что все коэффициенты модели, а также сама модель являются значимыми, что свидетельствует об адекватности модели, о том, что ее можно использовать как для анализа, так и для прогнозирования. Модель также является достаточно точной.
Для прогнозирования найдем прогнозное значение Х. В задаче сказано, что оно составляет 80% от его максимального значения. Используя функцию МАКС, получим что Хmax=29, а 80% от 29 равно 23,2. Таким образом, Х*=23,2. Найдем ожидаемый объем выпуска продукции Yт*=8,12+0,97*23,2=30,624 (млн руб.)
Для интервального прогноза подготовим:
- стандартная ошибка модели S?=1,19 (стандартная ошибка в Регрессии);
- среднее значение х=16,1 (СРЗНАЧ по Х);
- ?(хi-x)2=1008,9 (КВАДРОТКЛ по Х).
Стандартная ошибка прогнозирования составит:
S(Yт*)=1,19=0,461:

При tкр (10%;8)=1,86 в рамках доверительного интервала U(Yт*)= S(Yт*)* tкр=0,461*1,86=0,858.
Границы интервала будут:
Uнижн=30,624-0,858=29,766;
Uверх=30,624+0,858=31,482.
Таким образом, с надежностью 90% можно утверждать, что объем выпуска продукции будет составлять от 29,766 до 31,482 млн руб.
Для построения данного графика была выбрана диаграмма точечного типа. На графике представлены исходные значения Х и Y, теоретические (смоделированные) значения Y, а также результаты точечного и интервального прогноза. Была добавлена и линия тренда (прямая по модельным значениям Y).

Теперь составим уравнения нелинейной регрессии и приведем графики для составленных уравнений.
Построим степенную модель. Отобразим для этого исходные данные в виде точечной диаграммы, а затем добавим линию степенного тренда:

Получили уравнение степенной модели: Y=7,142.
Построим показательную модель. Отобразим для этого исходные данные в виде точечной диаграммы, а затем добавим линию экспоненциального тренда.

Получили