Смоленск 2007
Задание.
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции ( EMBED Equation.3 , млн. руб.) от объема капиталовложений ( EMBED Equation.3 , млн. руб.)
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков EMBED Equation.DSMT4 ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента EMBED Equation.3
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью EMBED Equation.3 - критерия Фишера EMBED Equation.3 , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя EMBED Equation.3 при уровне значимости EMBED Equation.3 , если прогнозное значения фактора Х составит 80% от его максимального значения.
Представить графически: фактические и модельные значения EMBED Equation.3 точки прогноза.
Составить уравнения нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение.
1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Расчет параметров линейного уравнения множественной регрессии с полным перечнем факторов проводиться с помощью инструмента анализа данных Регрессия:
в главном меню выберем последовательно пункты Сервис?Анализ данных?Регрессия;
в диалоговом окне Регрессия в поле Входной интервал Y вводим адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х вводим адрес диапазона, который содержит значения независимых переменных
EMBED PBrush
5) устанавливаем необходимые флажки и нажимаем ОК.
Результат регрессионного анализа:
Таблица 1
EMBED PBrush
Таблица 2
EMBED PBrush
Таблица 3
EMBED PBrush
Уравнение регрессии зависимости объема выпуска продукции от объема капиталовложений можно записать в следующем виде:
у = 8,12 + 0,97х
С увеличением объема капиталовложений на 1 млн руб. объем выпускаемой продукции увеличиться в среднем на 970 тыс. руб. Это свидетельствует об эффективности работы предприятий.
2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков EMBED Equation.DSMT4 ; построить график остатков.
Вычисление остатков производим с помощью Сервис?Анализ данных?Регрессия (п.1)
Таблица 4
EMBED PBrush
Остаточная сумма квадратов:
?e(t)2
Это значение можно найти в третьем столбце таблицы 2, равное – 11,35.
Дисперсия остатков S2 = 1,42 (значение из 4 столбца таблицы 2).
EMBED PBrush
3. Проверить выполнение предпосылок МНК.
Предпосылки МНК:
1) В задании у (объем выпуска продукции) является результативным признаком, а х1 (объем капиталовложений) – факторным признаком.
2) Так как у нас парная регрессия, то отсутствие мультиоколлинеарности выполняется автоматически.
3) Наличие (отсутствие) автокорреляции в отклонениях проверяют с помощью критерия Дарбина-Уотсона. Численное значение коэффициента равно:
dw = 110,5458 / 45,8017 = 2,4135
Определим выполняется МНК или нет:
1,08 1,36 2
На оси найдем точку dw = 2,4135, она находится в IV области. Следовательно, можно сделать вывод о том, что автокорреляция остатков в ряду динамики присутствует.
4) Равенство математического ожидания остатков 0 проверяется по t-критерию Стьюдента.
Проанализировав сумму остатков (таблица 4) получили -1,33 * 10-14 / 10 ? 0. значит t = (? E ??/ SE)? * ????v ???n > 0, следовательно, данная предпосылка МНК выполняется, так как tтабл = 2,31 > t
5) Постоянная дисперсия (т.е. выполнение свойства гомоскедастичности по тесту Голдфельда-Квандта)
Упорядочим n наблюдений по мере возрастания переменой х.
Разделим исходный блок на 3 части, причем 1 3 части равны по размеру n = 4
2 часть из рассмотрения исключается.
Для 1 и 3 частей строится уравнения регрессии.
EMBED PBrush
1 уравнение
EMBED PBrush
EMBED PBrush
EMBED PBrush
EMBED PBrush
2 уравнение
EMBED PBrush
EMBED PBrush
EMBED PBrush
EMBED PBrush
Следовательно уравнения регрессии будут иметь вид:
у1 = 0,048 + 0,796х1
у2 = -2 + 1,33х1
По уравнениям регрессии определяется остаточная дисперсия. Сравнение дисперсий происходит по F-критерию Фишера.
Если Fнаблюд. =S1y/S2y >Fкр.(a;k1;k2), то выполняется свойство гомоскедастичности (ГО)
Если F расч > F табл, то имеет место гетероскедастичность (ГЕ).
Чтобы найти значение F табл данного критерия определим степени свободы по формуле
К1=К2=(n-C-2*p)/2
n=10,
C=2 – количество исключаемых наблюдений во 2 части блока исходных данных
р=1 – число факторов
К1=К2=(10-2-2*1)/2 = 3
F табл = 10,13
Найдем F расч
?2 = ? ?i2 / (n-1)
?2(1 ур.) = 3,33 / 9 = 0,37
?2(2 ур.) = 4,75 / 9 = 0,53
F расч = 0,53 / 0,37 = 1,4324
Так как F расч < F табл , то можно сказать что больше нарушена предпосылка о равенстве дисперсий остаточных величин и следовательно выполняется свойство гомоскедастичности.
4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента EMBED Equation.3
Статистическую значимость параметров уравнения регрессии оценим с помощью t-критерия Стъюдента.
taj = aj / Sa j= aj / Se×vbjj
Расчетные значения t-критерия Стъюдента для коэффициентов уравнения регрессии а приведены в четвертом столбце таблицы 3 протокола Excel и составляет – 25,81. Табличное значение t-критерия Стъюдента можно найти с помощью функции СТЬЮДРАСПОБР
Табличное значение t-критерия при 5% уровне значимости и степенях свободы (10-1-1) составляет 2,31. Так как ?tа?>tтабл, то коэффициент а1 признается статистически значимым.
5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью EMBED Equation.3 - критерия Фишера EMBED Equation.3 , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера.
R2 (n-k-1)
F =
(1-R2)/ k
Значение F-критерия Фишера можно найти в таблице 2 протокола Excel, равное 666,10.
Табличное значение F-критерия можно найти с помощью функции FРАСПОБР.
Поскольку Fрас > Fтабл, уравнение регрессии следует признать адекватным.
Оценим качество уравнения регрессии с помощью коэффициента детерминации.
EMBED Equation.3
Значение коэффициента детерминации можно найти в таблице 1 - R2 = 0,99.
99% вариации объема выпуска продукции учтено в модели и обусловлено влиянием объема капиталовложений.
Найдем среднюю относительную ошибку аппроксимакции:
Eотн = (1/ n) * ?(Ei/y) * 100%
Eотн = 0,1 * 49,7% = 4,97%
В среднем расчетные значения у для линейной модели отличаются от фактических на 4,97%.
6. Осуществить прогнозирование среднего значения показателя EMBED Equation.3 при уровне значимости EMBED Equation.3 , если прогнозное значения фактора Х составит 80% от его максимального значения.
хпр = 0,8 × хmax
упр = a + b * xпр
хпр = 0,8 * 29 = 23,2
упр = 8,12 + 0,97*23,2 = 30,624
7. Представить графически: фактические и модельные значения EMBED Equation.3 точки прогноза.
EMBED PBrush
8. Составить уравнения нелинейной регрессии:
гиперболической;
Уравнение гиперболической функции: y = a + b / x.
Произведем линеаризацию модели путем замены Х = 1/х. В результате получим линейное уравнение: y = a + b *X.
Рассчитаем его параметры по данным таблицы 4.
Таблица 4
EMBED Equation.3 =-23,72.
EMBED Equation.3 =28,00.
Получим следующее уравнение гиперболической модели:
y = 28,003-23,72/x
cтепенной;
Уравнение степенной модели имеет вид: y=a*xb.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
lg y=lg a + b lg x.
Таблица 5
Обозначим Y = lg y, X = lg x, A = lg a. Тогда уравнение примет вид Y=A+b*X – линейное уравнение регрессии.
Рассчитаем параметры, используя данные таблицы 6.
Таблица 6
EMBED Equation.3 =0,45.
EMBED Equation.3 =0,85.
Уравнение регрессии будет иметь вид y = 0,85 - 0,45x.
Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:
y = 100,85*х0,84.
Получим уравнение y=7,14*х0,45.
показательной.
Уравнение показательной кривой: y = a*bx.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:
lg y = lg a + lg x*b.
Обозначим Y = lg y, B = lg b, A = lg a.
Получим линейное уравнение регрессии:
Y = A + B*x.
Рассчитаем его параметры, используя данные таблицы 7.
Таблица 7
EMBED Equation.3 =0,0206
EMBED Equation.3 =1,00
Уравнение будет иметь вид:
Y= 1,00-0,0206*х.
Перейдем к исходным переменным х и у. выполнив потенцирование данного уравнения:
y = 101,00*(100,0206)х =1,05*9,924х.
Привести графики построенных уравнений регрессии.
EMBED PBrush
Графики построенных уравнений регрессий
Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
EMBED Equation.3
R2 гип = 0,46
R2 степ = 0,96
R2 показ = 0,98
Найдем коэффициенты эластичности:
EMBED Equation.3 .
Эгип = 28,00 * 16,1/23,7 = 19,0204
Эстеп = 0,85 * 16,1/23,7 = 0,5774
Эпок = 1,00* 16,1/23,7 = 0,6793
Найдем средние относительные ошибки аппроксимакции:
EMBED Equation.3 .
Eотн степ = 0,1 * 1046,8% = 104,68%
Eотн гип = 0,1 * 237,00% = 23,70%
Eотн показ = 0,1 * 106,02% = 10,602%
Для выбора лучшей модели построим сводную таблицу результатов.
Таблица 8
Сравнив модели по данным характеристикам можно сделать вывод, самое большее значение F-критерия Фишера и большое значение коэффициента детерминации R2 имеет линейная модель, но т.к. у нее самая маленькая Eотн., то лучшей для построения прогнозов является показательная модель.