ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
EMBED MSPhotoEd.3
Контрольная работа
По курсу:
«Эконометрика»
Вариант №_6__
Уфа 2008 г
Задача 1
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн.руб.) от объема капиталовложений (Х, млн.руб.)
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков EMBED Equation.3 ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (?=0,05).
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (?=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве.
Осуществить прогнозирование среднего значения показателя Y при уровне значимости ?=0,01 при Х=80% от его максимального значения.
Представить графически фактических и модельных значений Y, точки прогноза.
Составить уравнения нелинейной регрессии:
Гиперболической;
Степенной;
Показательной.
Привести графики построенных уравнений регрессии.
9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам. Сделать вывод.
Решение
1. Параметры уравнения линейной регрессии.
Уравнение линейной регрессии имеет вид: EMBED Equation.3 =a+b x.
Значения параметров a и b линейной модели определим, используя данные таблицы 1.
EMBED Equation.3 = EMBED Equation.3 = EMBED Equation.2
EMBED Equation.3 = EMBED Equation.3 = 33,6-0,91*23,5=12,24. EMBED Equation.3 =12,24+0,91* x.
Таким образом, с увеличением объема капиталовложений на 1 млн. руб. объем выпуска продукции увеличится на 910 тыс.руб.
2. Вычисление остатков, остаточной суммы квадратов, оценка дисперсии остатков, построение графика остатков.
Расчеты представим в таблице 1
Остаточная дисперсия, показатель адекватности модели, для однофакторного уравнения рассчитывается по формуле: EMBED Equation.3 .
Используем данные табл. 1 получим: EMBED Equation.3 12,24/8=1,5.
Чем меньше значение остаточной дисперсии, тем лучше регрессионное уравнение.
График остатков построим с помощью инструмента Excel Регрессия.
Рис.1 График остатков
3. Проверка выполнения предпосылок МНК.
Основными предположениями классической модели линейной регрессии являются следующие:
М(?i)=0,
M(?i2)=?2 – дисперсия случайной компоненты – константа,
COV(?i, ?j)=0.
Нарушение тех или иных предпосылок проверяется на основе выдвижения соответствующих гипотез относительно ?. Оценочными значениями ?i являются величины yi- EMBED Equation.3 i= EMBED Equation.3 i. Все критерии относительно ? основываются на этих оценочных значениях.
Для проверки второго условия МНК, то есть условия постоянства дисперсии случайно компоненты ? используем F-статистику, основанную на том, что величина F
( EMBED Equation.3 12+ EMBED Equation.3 22+ … .+ EMBED Equation.3 n/22)
F= ______________________
( EMBED Equation.3 n/2+12+ EMBED Equation.3 n/2+22+…+ EMBED Equation.3 n2)
подчиняется F-распределению со степенями свободы n/2-1 и n/2-1. Если проверяется гипотеза о росте дисперсии Fрасч. должно быть меньше Fтабл., если проверяется гипотеза об уменьшении дисперсии, Fрасч. должно быть больше Fтабл.. Выполнение второго условия называется гомоскедастичностью, а нарушение его – гетероскедастичностью.
F = EMBED Equation.3 EMBED Equation.3 .
Табличное значение F- распределения при заданной вероятности 0,95 и степенях свободы (n/2-1) равно F(0,05; 4;4) =6,39. Fрасч.< Fтабл. Второе условие МНК (гомоскедастичность) с вероятностью 95% нарушено, принимается гипотеза о росте дисперсии .
Наиболее часто нарушаемым является третье условие. Показатель ковариации (cov) устанавливает наличие зависимости между случайными переменными. Поэтому нарушение третьего условия МНК свидетельствует о зависимости случайных компонент для наблюдений с различными номерами (i и j). Выполнение этого условия, как правило, проверяется на основе критерия Дарбина-Уотсона:
D-W= EMBED Equation.3 ( EMBED Equation.3 i- EMBED Equation.3 i-1)2 / EMBED Equation.3 EMBED Equation.3 i2 где
EMBED Equation.3 i2 — остатки, получаемые при оценивании линейной модели наблюдений,
и подчиняется распределению Дарбина-Уотсона, для которого имеются таблицы квантилей. Сравнивая значения D-Wрасч. и D-Wтабл. можно проверить гипотезу о нарушении условия 3). Нарушение условия 3) называется автокорреляцией. При проверке наличия автокорреляции используются табличные данные. При количестве наблюдений более 10 d1=0,95; d2=1,23.
D-W?d1 – гипотеза об отсутствии автокорреляции отвергается;
d2? D-W?4-d2 – гипотеза об отсутствии автокорреляции принимается;
D-W?4-d1 – принимается гипотеза о наличии отрицательной автокорреляции.
Случаи, когда d1?D-W?d2 и 4-d2?D-W?4-d1, являются неопределенными, когда гипотеза не принимается и не отвергается.
Расчет статистики Дарбина-Уотсона проведем, используя данные табл.1
D-W = 37,33 / 12,02=0,99.
Критические значения по таблице распределения статистики Дарбина-Уотсона при n=10 составили d 1 = 0,95 и d2=1,23.
Расчетный показатель попал в область d1?D-W?d2, гипотеза не принимается и не отвергается.
4. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (?=0,05).
Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений критерия Стьюдента для соответствующих коэффициентов регрессии : tрасч = b/ mb и tрасч = а/ mа.
m b – стандартная ошибка коэффициента b
ma – стандартная ошибка коэффициента а
m b = EMBED Equation.3 = EMBED Equation.3 ma= EMBED Equation.3
S2 – остаточная дисперсия на одну степень свободы.
Затем расчетные значения сравниваются с табличными. Критические значения t-статистики определяется при (n-2) степенях свободы и соответствующем уровне значимости.
Если tрасч не входит в заданный интервал, то выдвинутая гипотеза о том, что х не влияет на у, не принимается, т.е. если | tрасч| > t табл коэффициент регрессии считается значимым.
m b = EMBED Equation.3 = EMBED Equation.3 = 0,04
tb = 0,91/0,04=21,34. Расчетный показатель больше t табл.=2,306 с заданной вероятностью 95% и не входит в заданный интервал .
m а = EMBED Equation.3 = EMBED Equation.3 =1,07
tа = 12,24/1,07=11,41 . Расчетный показатель больше t табл. с заданной вероятностью 95% и степенями свободы (n-2) = 2,3.
Гипотеза о том, что х влияет на у не существенно отклоняется, коэффициенты уравнения регрессии значимые.
5. Вычисление коэффициента детерминации, проверка значимости уравнения регрессии с помощью F-критерия Фишера (?=0,05), относительная ошибка аппроксимации. Вывод о качестве модели.
Величина RXY2 называется коэффициентом детерминации и показывает долю изменения (вариации) результативного признака под действием факторного признака. Чем ближе его значение к единице, тем теснее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает значимость переменных.
EMBED Equation.3 = EMBED Equation.3
Вариация результата Y (объем выпуска продукции) на 99,1% объясняется вариацией фактора Х (объем капиталовложений).
F-критерий Фишера EMBED Equation.3 .
Если расчетное значение этого критерия со степенями свободы (m) и (n-m-1), где n- количество наблюдений, m – число включенных в модель факторов, больше табличного значения критерия Фишера при заданном уровне значимости (достаточно большой вероятности), то модель признается значимой.
Fрасч EMBED Equation.2
Fрасч больше табличного значения F0,05;1;8 = 5,32, т.е. не входит в правдоподобную область с плотностью распределения р=0,95 (рис.1.5) – гипотеза о несущественности уравнения отклоняется. Модель значима с вероятностью 95%.
6. Прогнозирование среднего значения показателя Y при уровне значимости ?=0,01 при Х=80% от его максимального значения.
Для прогнозирования результативного показателя подставим в уравнение
EMBED Equation.3 =12,71+0,72* x значение факторного показателя, равного 80% от его максимального значения
EMBED Equation.3 = 0,8*39=31,2.
Тогда точечный прогноз составит: EMBED Equation.3 = 12,24+0,91*31,2=40,6.
7. График фактических и модельных значений Y, точки прогноза.
График прогноза представим на рисунке 1.7.
Рис. 2. График по модели
8. Уравнения нелинейной регрессии:
8.1 Гиперболическая модель
Уравнение гиперболической функции: EMBED Equation.3 = a + b/x.
Произведем линенеаризацию модели путем замены X = 1/x. В результате получим линейное уравнение EMBED Equation.3 = a + bX.
Рассчитаем параметры уравнения по данным таблицы 2.
b = EMBED Equation.3 = EMBED Equation.2
а = EMBED Equation.3 =33,6+415,75*0,05=54,18.
Получим следующее уравнение гиперболической модели:
EMBED Equation.3 = 54,18-415,75/х.
8.2 Степенная модель
Уравнение степенной модели имеет вид: EMBED Equation.3 =аxb
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения : lg EMBED Equation.3 = lg a + b lg x.
Обозначим через Y=lg EMBED Equation.3 , X=lg x, A=lg a.
Тогда уравнение примет вид: Y = A + bX – линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 3.
b = EMBED Equation.3 = EMBED Equation.2
A = EMBED Equation.3 = 1,51-0,63*1,34=0,68
Уравнение регрессии будет иметь вид: Y = 0,68+0,63* Х.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.
EMBED Equation.3 = 100,68* х0,63.
Получим уравнение степенной модели регрессии:
EMBED Equation.3 = 4,75* х0,63.
8.3 Показательная модель
Уравнение показательной кривой: EMBED Equation.3 =abx.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения: lg EMBED Equation.3 = lg a + x lg b. Обозначим: Y = lg EMBED Equation.3 , B = lg b, A = lg a.
Получим линейное уравнение регрессии: Y = A + B x.
Рассчитаем его параметры, используя данные таблицы 4.
В = EMBED Equation.3 = EMBED Equation.2
А = EMBED Equation.3 = 1,51-0,01*33,6=1,24
Уравнение будет иметь вид: Y = 1,24+0,01х.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
EMBED Equation.3 =101,24* ( 100,01)х = 17,38*1,03х.
Графики построенных моделей:
Рис.3. Гиперболическая
Рис.4. Степенная
Рис.5. Показательная
9. Сравнение моделей по характеристикам: коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Вывод.
9.1 Гиперболическая модель
Коэффициент детерминации: EMBED Equation.3 = EMBED Equation.3
Вариация результата Y на 89,5% объясняется вариацией фактора Х.
Коэффициент эластичности:
EMBED Equation.3 = EMBED Equation.3 = 0,08.
Это означает, что при увеличении фактора Х на 1 % результирующий показатель изменится на 0,08 %.
Бета-коэффициент :
Sx= EMBED Equation.3 =0,02 Sy= EMBED Equation.3 =8,35 EMBED Equation.3 54,18*0,02/8,35=0,12.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 0,12 среднеквадратического отклонения этого показателя.
Средняя относительная ошибка аппроксимации:
EMBED Equation.3 отн = 72,6/ 10= 7,26 %.
В среднем расчетные значения EMBED Equation.3 для гиперболической модели отличаются от фактических значений на 7,26%.
9.2 Степенная модель
Коэффициент детерминации: EMBED Equation.3 = EMBED Equation.3
Вариация результата Y на 97,3% объясняется вариацией фактора Х. Коэффициент эластичности:
EMBED Equation.3 = EMBED Equation.3 = 0,60.
Это означает, что при увеличении факторного признака на 1 % результирующий показатель увеличится на 0,6%.
Бета-коэффициент:
EMBED Equation.3 , Sy= EMBED Equation.3 и Sx= EMBED Equation.3 .
Sx= EMBED Equation.3 =0,17 Sy= EMBED Equation.3 =0,11 EMBED Equation.3 0,68*0,17/0,11=1,07.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 1,07 среднеквадратического отклонения этого показателя.
EMBED Equation.3 отн= EMBED Equation.3 = 34,0/10 = 3,4%.
В среднем расчетные значения EMBED Equation.3 для степенной модели отличаются от фактических значений на 3,4%.
9.3 Показательная модель
Коэффициент детерминации: EMBED Equation.3 = EMBED Equation.3
Вариация результата Y на 97,9% объясняется вариацией фактора Х. Коэффициент эластичности:
EMBED Equation.3 EMBED Equation.3 = 19,26.
Это означает, что при росте фактора Х на 1 % результирующий показатель Y изменится на 19,26 %.
Бета-коэффициент :
Sx= EMBED Equation.3 =9,1 Sy= EMBED Equation.3 =0,11 EMBED Equation.3 1,24*9,1/0,11=104,57.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 104,57 среднеквадратического отклонения этого показателя.
EMBED Equation.3 отн= 38,23/ 10 = 3,82%.
В среднем расчетные значения EMBED Equation.3 для показательной модели отличаются от фактических значений на 3,82%.
Вывод.
Лучшей из уравнений нелинейной регрессии является степенная:
выше коэффициент детерминации, наименьшая относительная ошибка. Модель можно использовать для прогнозирования.