Задача По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн руб.) от объема капиталовложений (Х, млн руб.). Х 12 4 18 27 26 29 1 13 26 5
Y 21 10 26 33 34 37 9 21 32 14
Требуется: Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков. Проверить выполнение предпосылок МНК. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (?=0,05). Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (?=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели. Осуществить прогнозирование среднего значения показателя Y при уровне значимости ?=0,1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представить графически фактические и модельные значения Y точки прогноза. Составить уравнения нелинейной регрессии: гиперболической; степенной; показательной. Привести графики построенных уравнений регрессии. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод. Решение Расчет параметров уравнения линейной регрессии проводится с помощью инструмента анализа данных в Excel. Однако мы видим, что сначала необходимо отсортировать исходные данные по возрастанию переменной Х, так как в задании присутствует необходимость проверки предпосылок МНК. Выполним сортировку: Данные – Сортировка – По переменной Х – По возрастанию:
Получим:
Далее выполним: Анализ данных – Регрессия:
Далее введем входные интервалы для Х и Y, поставим галочку на Метки, осуществим запрос на остатки и график остатков:
X 0,967688 0,037494 25,80899 5,45E-09 0,881226 1,054149 0,881226 1,054149
Результат регрессионного анализа имеет вид: ВЫВОД ОСТАТКА
Наблюдение Предсказанное Y Остатки
1 9,087918 -0,08792
2 11,99098 -1,99098
3 12,95867 1,041332
4 19,73248 1,267519
5 20,70017 0,299831
6 25,53861 0,461394
7 33,28011 0,719893
8 33,28011 -1,28011
9 34,24779 -1,24779
10 36,18317 0,81683
Таким образом, исходя из коэффициентов, получаем уравнение зависимости объема выпуска продукции от объема капиталовложений: Y=8,12+0,97Х. С увеличением объема капиталовложений на 1 млн руб. объем выпускаемой продукции увеличится в среднем на 970 тыс. руб. Остатки получены по итогам регрессии: Остатки
-0,08792
-1,99098
1,041332
1,267519
0,299831
0,461394
0,719893
-1,28011
-1,24779
0,81683
Остаточная сумма квадратов равна 11,35 (столбец SS остатка в табл. «Дисперсионный анализ»). Дисперсия остатков S?2=1,42 (столбец MS остатка в табл. «Дисперсионный анализ). График остатков ранее уже был получен. Для удобства преобразуем его в точечную диаграмму, соединив точки:
1) Проверим выполнение свойства случайности остатков построенной модели зависимости объемов выпуска продукции от объема капиталовложений. Проверку осуществим с помощью критерия поворотных точек. По графику остатков видно, что количество поворотов p=5. При n=10, pкр= – 1,96={2,9}=2. P=5>pкр=2, следовательно, свойство случайности для ряда остатков выполняется. 2) Свойство нулевого математического ожидания для линейной модели выполняется автоматически. 3) Проверим выполнение свойства постоянной дисперсии остаточной компоненты с помощью критерия Голдфельда – Квандта. Возьмем первые и последние четыре уровня, средние два уровня не рассматриваем. С помощью функции Регрессия построим модели по первым и последним четырем наблюдениям:
Итоги регрессии для первых четырех наблюдений:
Итоги регрессии для последних четырех наблюдений:
Для первой модели SS1=4,75; для второй модели SS2=3,33. F= ==1,43. Критическое значение Fкр при ?=5% и числах степеней свободы k1=k2=4-1-1=2 найдем с помощью функции FРАСПОБР:
Получили, что Fкр=19. F=1,43<Fкр=19, следовательно, свойство постоянной дисперсии остаточной компоненты выполняется, модель гомоскедастичная. 4) Проверим выполнение свойства независимости остатков, используя критерий Дарбина – Уотсона. Вычислим d-статистику с помощью функций СУММКВ и СУММКВРАЗН:
СУММКВРАЗН(Е)=
22,16079
СУММКВ(Е)= 11,34662
d=
1,953075
Определим критические уровни d1 и d2 при n=10 по таблице. Получим, d1=0,88 и d2=1,32. Таким образом, d больше верхнего критического уровня и меньше 2, а это говорит о том, что свойство независимости остаточной компоненты выполняется. 5) Проверим выполнение свойства нормального распределения остатков, используя R/S критерий. R/S== 2,736084.
Критический интервал при n=10 и ?=5% будет (2,67;3,57). 2,74Є(2,67;3,57), следовательно, свойство нормального распределения остатков для построенной модели выполняется. Проведенная проверка предпосылок регрессионного анализа показала, что для модели выполняются все условия Гаусса – Маркова. Таким образом, МНК – наилучший метод моделирования. Выпишем из Регрессии t-статистику для коэффициентов модели: а=8,12; t(a)=11,41 b=0,97; t(b)=25,81 (столбец « t-статистик» Регрессии). Определим tкр с помощью функции СТЬЮДРАСПОБР(5%; 8): tкр=2,31. Сравним |t(a)|=11,41>tкр=2,31, следовательно, свободный коэффициент является значимым, его необходимо сохранить в модели. |t(b)|=25,81>tкр=2,31, следовательно, коэффициент регрессии b является значимым, его и фактор объема капиталовложений нужно также сохранить в модели.
Оба коэффициента являются значимыми и необходимыми в данной модели. Выпишем из Регрессии R2=0,99=99%. Таким образом, вариация объема выпуска продукции Y на 99% объясняется по полученному уравнению вариацией объема капиталовложений. Оценим значимость уравнения с помощью F-критерия Фишера. Выпишем из Регрессии F=666,1. Fкр=5,32, найдем с помощью функции FРАСПОБР(5%; k1=1; k2=8):
Сравним F=666,1>Fкр=5,32, следовательно, уравнение модели является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель факторной переменной X. Найдем теперь среднюю относительную ошибку аппроксимации. Для этого используем исходные значения Yi и найденные Регрессией остатки Ei. Вычислим относительные погрешности: Еотн=||*100%:
С помощью СРЗНАЧ найдем Еотн=4,97%. Сравним Еотн=4,97%Є(0; 5%), следовательно, модель является достаточно точной, однако точность модели приближена к удовлетворительной. Вывод: в результате исследования получилось, что все коэффициенты модели, а также сама модель являются значимыми, что свидетельствует об адекватности модели, о том, что ее можно использовать как для анализа, так и для прогнозирования. Модель также является достаточно точной. Для прогнозирования найдем прогнозное значение Х. В задаче сказано, что оно составляет 80% от его максимального значения. Используя функцию МАКС, получим что Хmax=29, а 80% от 29 равно 23,2. Таким образом, Х*=23,2. Найдем ожидаемый объем выпуска продукции Yт*=8,12+0,97*23,2=30,624 (млн руб.) Для интервального прогноза подготовим: - стандартная ошибка модели S?=1,19 (стандартная ошибка в Регрессии); - среднее значение х=16,1 (СРЗНАЧ по Х); - ?(хi-x)2=1008,9 (КВАДРОТКЛ по Х). Стандартная ошибка прогнозирования составит: S(Yт*)=1,19=0,461:
При tкр (10%;8)=1,86 в рамках доверительного интервала U(Yт*)= S(Yт*)* tкр=0,461*1,86=0,858. Границы интервала будут: Uнижн=30,624-0,858=29,766; Uверх=30,624+0,858=31,482. Таким образом, с надежностью 90% можно утверждать, что объем выпуска продукции будет составлять от 29,766 до 31,482 млн руб. Для построения данного графика была выбрана диаграмма точечного типа. На графике представлены исходные значения Х и Y, теоретические (смоделированные) значения Y, а также результаты точечного и интервального прогноза. Была добавлена и линия тренда (прямая по модельным значениям Y).
Теперь составим уравнения нелинейной регрессии и приведем графики для составленных уравнений. Построим степенную модель. Отобразим для этого исходные данные в виде точечной диаграммы, а затем добавим линию степенного тренда:
Получили уравнение степенной модели: Y=7,142. Построим показательную модель. Отобразим для этого исходные данные в виде точечной диаграммы, а затем добавим линию экспоненциального тренда.