ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
EMBED MSPhotoEd.3
Контрольная работа
По курсу:
«Эконометрика»
Вариант №_9__
Уфа 2008 г
Задача 1
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн.руб.) от объема капиталовложений (Х, млн.руб.)
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков EMBED Equation.3 ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (?=0,05).
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (?=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве.
Осуществить прогнозирование среднего значения показателя Y при уровне значимости ?=0,01 при Х=80% от его максимального значения.
Представить графически фактических и модельных значений Y, точки прогноза.
Составить уравнения нелинейной регрессии:
Гиперболической;
Степенной;
Показательной.
Привести графики построенных уравнений регрессии.
9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам. Сделать вывод.
Решение
1. Параметры уравнения линейной регрессии.
Уравнение линейной регрессии имеет вид: EMBED Equation.3 =a+b x.
Значения параметров a и b линейной модели определим, используя данные таблицы 1.
EMBED Equation.3 = EMBED Equation.3 = EMBED Equation.2
EMBED Equation.3 = EMBED Equation.3 = 23,7-0,97*16,1=8,12. EMBED Equation.3 =8,12*0,97 x.
Таким образом, с увеличением объема капиталовложений на 1 млн.руб. объем выпуска продукции увеличится на 970 тыс.руб.
2. Вычисление остатков, остаточной суммы квадратов, оценка дисперсии остатков, построение графика остатков.
Расчеты представим в таблице 1
Остаточная дисперсия, показатель адекватности модели, для однофакторного уравнения рассчитывается по формуле: EMBED Equation.3 .
Используем данные табл. 1 получим: EMBED Equation.3 76,97/8=9,62.
Чем меньше значение остаточной дисперсии, тем лучше регрессионное уравнение.
График остатков построим с помощью инструмента Excel Регрессия.
Рис.1 График остатков
3. Проверка выполнения предпосылок МНК.
Основными предположениями классической модели линейной регрессии являются следующие:
М(?i)=0,
M(?i2)=?2 – дисперсия случайной компоненты – константа,
COV(?i, ?j)=0.
Нарушение тех или иных предпосылок проверяется на основе выдвижения соответствующих гипотез относительно ?. Оценочными значениями ?i являются величины yi- EMBED Equation.3 i= EMBED Equation.3 i. Все критерии относительно ? основываются на этих оценочных значениях.
Для проверки второго условия МНК, то есть условия постоянства дисперсии случайно компоненты ? используем F-статистику, основанную на том, что величина F
( EMBED Equation.3 12+ EMBED Equation.3 22+ … .+ EMBED Equation.3 n/22)
F= ______________________
( EMBED Equation.3 n/2+12+ EMBED Equation.3 n/2+22+…+ EMBED Equation.3 n2)
подчиняется F-распределению со степенями свободы n/2-1 и n/2-1. Если проверяется гипотеза о росте дисперсии Fрасч. должно быть меньше Fтабл., если проверяется гипотеза об уменьшении дисперсии, Fрасч. должно быть больше Fтабл.. Выполнение второго условия называется гомоскедастичностью, а нарушение его – гетероскедастичностью.
F = EMBED Equation.3 EMBED Equation.3 .
Табличное значение F- распределения при заданной вероятности 0,95 и степенях свободы (n/2-1) равно F(0,05; 4;4) =6,39. Fрасч.< Fтабл. Второе условие МНК (гомоскедастичность) с вероятностью 95% нарушено, принимается гипотеза о росте дисперсии .
Наиболее часто нарушаемым является третье условие. Показатель ковариации (cov) устанавливает наличие зависимости между случайными переменными. Поэтому нарушение третьего условия МНК свидетельствует о зависимости случайных компонент для наблюдений с различными номерами (i и j). Выполнение этого условия, как правило, проверяется на основе критерия Дарбина-Уотсона:
D-W= EMBED Equation.3 ( EMBED Equation.3 i- EMBED Equation.3 i-1)2 / EMBED Equation.3 EMBED Equation.3 i2 где
EMBED Equation.3 i2 — остатки, получаемые при оценивании линейной модели наблюдений,
и подчиняется распределению Дарбина-Уотсона, для которого имеются таблицы квантилей. Сравнивая значения D-Wрасч. и D-Wтабл. можно проверить гипотезу о нарушении условия 3). Нарушение условия 3) называется автокорреляцией. При проверке наличия автокорреляции используются табличные данные. При количестве наблюдений более 10 d1=0,95; d2=1,23.
D-W?d1 – гипотеза об отсутствии автокорреляции отвергается;
d2? D-W?4-d2 – гипотеза об отсутствии автокорреляции принимается;
D-W?4-d1 – принимается гипотеза о наличии отрицательной автокорреляции.
Случаи, когда d1?D-W?d2 и 4-d2?D-W?4-d1, являются неопределенными, когда гипотеза не принимается и не отвергается. В этих случаях обращаются к другим критериям.
Расчет статистики Дарбина-Уотсона проведем, используя данные табл.1.
D-W = 32,29/11,35=2,85.
Критические значения по таблице распределения статистики Дарбина-Уотсона при n=10 составили d 1 = 0,95 и d2=1,23.
Расчетный показатель попал в область D-W?4-d1 – принимается гипотеза о наличии отрицательной автокорреляции.
4. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (?=0,05).
Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений критерия Стьюдента для соответствующих коэффициентов регрессии : tрасч = b/ mb и tрасч = а/ mа.
m b – стандартная ошибка коэффициента b
ma – стандартная ошибка коэффициента а
m b = EMBED Equation.3 = EMBED Equation.3 ma= EMBED Equation.3
S2 – остаточная дисперсия на одну степень свободы.
Затем расчетные значения сравниваются с табличными. Критические значения t-статистики определяется при (n-2) степенях свободы и соответствующем уровне значимости.
Если tрасч не входит в заданный интервал, то выдвинутая гипотеза о том, что х не влияет на у, не принимается, т.е. если | tрасч| > t табл коэффициент регрессии считается значимым.
m b = EMBED Equation.3 = EMBED Equation.3 = 0,037.
tb = 0,97/0,037=25,81. Расчетный показатель больше t табл.=2,306 с заданной вероятностью 95% и не входит в заданный интервал.
m а = EMBED Equation.3 = EMBED Equation.3 =0,71
tа = 8,12/0,71=11,41 . Расчетный показатель больше t табл. с заданной вероятностью 95% и степенями свободы (n-2) = 2,306.
Гипотеза о том, что х влияет на у не существенно отклоняется, коэффициенты уравнения регрессии значимые.
5. Вычисление коэффициента детерминации, проверка значимости уравнения регрессии с помощью F-критерия Фишера (?=0,05), относительная ошибка аппроксимации. Вывод о качестве модели.
Величина RXY2 называется коэффициентом детерминации и показывает долю изменения (вариации) результативного признака под действием факторного признака. Чем ближе его значение к единице, тем теснее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает значимость переменных.
EMBED Equation.3 = EMBED Equation.3
Вариация результата Y (объем выпуска продукции) на 99,4% объясняется вариацией фактора Х (объем капиталовложений).
F-критерий Фишера EMBED Equation.3 .
Если расчетное значение этого критерия со степенями свободы (m) и (n-m-1), где n- количество наблюдений, m – число включенных в модель факторов, больше табличного значения критерия Фишера при заданном уровне значимости (достаточно большой вероятности), то модель признается значимой.
Fрасч EMBED Equation.2
Fрасч многократно больше табличного значения F0,05;1;8 = 5,32, т.е. не входит в правдоподобную область с плотностью распределения р=0,95 – гипотеза о несущественности уравнения отклоняется. Модель значима с вероятностью 95%.
6. Прогнозирование среднего значения показателя Y при уровне значимости ?=0,01 при Х=80% от его максимального значения.
Для прогнозирования результативного показателя подставим в уравнение
EMBED Equation.3 =8,12+0,97x значение факторного показателя, равного 80% от его максимального значения
EMBED Equation.3 = 0,8*29=23,2.
Тогда точечный прогноз составит: EMBED Equation.3 = 8,12+0,97*23,2=30,6.
7. График фактических и модельных значений Y, точки прогноза.
График прогноза представим на рисунке 2.
Рис. 2. График по модели
8. Уравнения нелинейной регрессии:
8.1 Гиперболическая модель
Уравнение гиперболической функции: EMBED Equation.3 = a + b/x.
Произведем линеаризацию модели путем замены X = 1/x. В результате получим линейное уравнение EMBED Equation.3 = a + bX.
Рассчитаем параметры уравнения по данным таблицы 2.
b = EMBED Equation.3 = EMBED Equation.2
а = EMBED Equation.3 =23,7+23,72*0,18=28,0.
Получим следующее уравнение гиперболической модели:
EMBED Equation.3 =28-23,72/х.
8.2 Степенная модель
Уравнение степенной модели имеет вид: EMBED Equation.3 =аxb
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения : lg EMBED Equation.3 = lg a + b lg x.
Обозначим через Y=lg EMBED Equation.3 , X=lg x, A=lg a.
Тогда уравнение примет вид: Y = A + bX – линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 3.
b = EMBED Equation.3 = EMBED Equation.2
A = EMBED Equation.3 = 1,33-0,45*1,05=0,85
Уравнение регрессии будет иметь вид: Y = 0,85+0,45 Х.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.
EMBED Equation.3 = 100,85* х0,45.
Получим уравнение степенной модели регрессии:
EMBED Equation.3 = 7,14* х0,45.
8.3 Показательная модель
Уравнение показательной кривой: EMBED Equation.3 =abx.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения: lg EMBED Equation.3 = lg a + x lg b. Обозначим: Y = lg EMBED Equation.3 , B = lg b, A = lg a.
Получим линейное уравнение регрессии: Y = A + B x.
Рассчитаем его параметры, используя данные таблицы 4.
В = EMBED Equation.3 = EMBED Equation.2
А = EMBED Equation.3 = 1,33-0,02*16,1=0,997
Уравнение будет иметь вид: Y = 0,997+0,02х.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
EMBED Equation.3 =100,997* ( 100,02)х = 9,92*1,05х.
Графики построенных моделей:
Рис.3. Гиперболическая
Рис.4. Степенная
Рис.5. Показательная
9. Сравнение моделей по характеристикам: коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Вывод.
9.1 Гиперболическая модель
Коэффициент детерминации: EMBED Equation.3 = EMBED Equation.3
Вариация результата Y на 46,8% объясняется вариацией фактора Х.
Коэффициент эластичности:
EMBED Equation.3 = EMBED Equation.3 = 0,21.
Это означает, что при увеличении фактора Х на 1 % результирующий показатель увеличится на 0,21 %.
Бета-коэффициент :
Sx= EMBED Equation.3 =0,28 Sy= EMBED Equation.3 =9,78 EMBED Equation.3 28*0,28/9,78=0,81.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 0,81 среднеквадратического отклонения этого показателя.
Средняя относительная ошибка аппроксимации:
EMBED Equation.3 отн = 37,05/ 10= 3,7 %.
В среднем расчетные значения EMBED Equation.3 для гиперболической модели отличаются от фактических значений на 3,7%.
9.2 Степенная модель
Коэффициент детерминации: EMBED Equation.3 = EMBED Equation.3
Вариация результата Y на 92,8% объясняется вариацией фактора Х. Коэффициент эластичности:
EMBED Equation.3 = EMBED Equation.3 = 0, 67.
Это означает, что при увеличении факторного признака на 1 % результирующий увеличится на 0,67%.
Бета-коэффициент:
EMBED Equation.3 , Sy= EMBED Equation.3 и Sx= EMBED Equation.3 .
Sx= EMBED Equation.3 =0,45 Sy= EMBED Equation.3 =0,21 EMBED Equation.3 0,85*0,45/0,21=1,82.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 1,82 среднеквадратического отклонения этого показателя.
EMBED Equation.3 отн= EMBED Equation.3 = 100,89/10= 10,09%.
В среднем расчетные значения EMBED Equation.3 для степенной модели отличаются от фактических значений на 10,09%.
9.3 Показательная модель
Коэффициент детерминации: EMBED Equation.3 = EMBED Equation.3
Вариация результата Y на 94,1% объясняется вариацией фактора Х. Коэффициент эластичности:
EMBED Equation.3 EMBED Equation.3 = 12,08.
Это означает, что при росте фактора Х на 1 % результирующий показатель Y изменится на 12,08 %.
Бета-коэффициент :
Sx= EMBED Equation.3 =10,04 Sy= EMBED Equation.3 =0,21 EMBED Equation.3 0,997*10,04/0,21=46,94.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 46,94 среднеквадратического отклонения этого показателя.
EMBED Equation.3 отн= 106,02/ 10 = 10,6%.
В среднем расчетные значения EMBED Equation.3 для показательной модели отличаются от фактических значений на 10,6%.
Вывод.
Лучшей из уравнений нелинейной регрессии является показательная:
выше коэффициент детерминации, наименьшая относительная ошибка. При использовании показательной модели можно получит более точный прогноз. Из всех моделей для прогноза самая точная линейная модель.