Министерство образования и науки РФ
Федеральное агентство по образованию
Государственное образовательное учреждение
Высшего профессионального образования
Всероссийский заочный финансово-экономический институт
Филиал в г. Туле
Лабораторная работа
по дисциплине «Эконометрика»
Выполнил: студент третьего курса
Факультета УС
Специальность БУА и А
Вечерняя группа
Меркулова Ольга Вячеславовна
05убб 03031
Проверил: Арсеньев Ю.Н.
Тула 2008
Условие задачи
В таблице 1 представлены данные о деятельности крупнейших компаний США в 1996 г.
Таблица 1.
Принятые обозначения:
Y – чистый доход, млдр. долл.;
X1 – оборот капитала, млрд. долл;
X2 – использованный капитал, млрд. долл.;
X3 – численность служащих, тыс. чел.;
X4 – рыночная капитализация компании, млрд. долл.
Задание
1. Составьте матрицу парных коэффициентов корреляции исходных переменных, оцените их статистическую значимость.
2. Постройте уравнение регрессии от всех факторов, в линейной форме. Установите, какие факторы мультиколлинеарны.
3. Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости параметров регрессионной модели проверьте с помощью F-критерия; оцените качество уравнения регрессии с помощью коэффициента детерминации R2.
4. Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, EMBED Equation.3 и EMBED Equation.3 коэффициентов.
5. Оцените точность уравнения через среднюю относительную ошибку аппроксимации.
6. Отберите информативные факторы в модель по t-критерию для коэффициентов регрессии. Постройте модель только с информативными факторами и оцените ее параметры.
7. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимального значения.
8. Рассчитайте ошибку и доверительный интервал прогноза для уровня значимости 5 или 10% (а=0,5 или а=0,10).
Решение:
Составим матрицу парных коэффициентов корреляции исходных переменных, используя инструмент Корреляции (анализ данных EXCEL).
Рис. 1.
Рис. 2.
Получаем:
.
Рис. 3.
Значимость проверим с помощью t-статистики Стьюдента:
EMBED Equation.3 .
Табличное значение при уровне значимости 5% и степенях свободы k=n-2=25-2=23 равно tкр = 2,07.
ryx1 = 0,848, tр=0,848 EMBED Equation.3 =36,823. Т.к. 36,823>2,07; коэффициент корреляции значим.
ryx2 = 0,763, tр=0,763 EMBED Equation.3 =27,174. Т.к. 27,174>2,07; коэффициент корреляции значим.
ryx3 = 0,830, tр=0,830 EMBED Equation.3 =34,169. Т.к. 34,169>2,07; коэффициент корреляции значим.
ryx4 = 0,269, tр=0,269 EMBED Equation.3 =6,423. Т.к. 6,423>2,07; коэффициент корреляции значим.
rx1x2 = 0,898, tр=0,898 EMBED Equation.3 =46,927. Т.к. 46,927>2,07; коэффициент корреляции значим.
rx1x3 = 0,912, tр=0,912 EMBED Equation.3 =51,005. Т.к. 51,005>2,07; коэффициент корреляции значим.
rx1x4 = 0,249, tр=0,249 EMBED Equation.3 =5,906. Т.к. 5,906>2,07; коэффициент корреляции значим.
rx2x3 = 0,713, tр=0,713 EMBED Equation.3 =23,356. Т.к. 23,356>2,07; коэффициент корреляции значим.
rx2x4 = 0,348, tр=0,348 EMBED Equation.3 =8,551. Т.к. 8,551>2,07; коэффициент корреляции значим.
rx3x4 = 0,115, tр=0,115 EMBED Equation.3 =2,667. Т.к. 2,667>2,07; коэффициент корреляции значим.
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, имеет тесную связь (r>0,7) с Х1 (ryx2=0,763298) и с Х3 (ryx3=0,829568).
Проверим наличие мультиколлениарности.
Т.к. rx1x2=0,897947>0,7; rx1x3=0,911601>0,7; rx2x3=0,712514>0,7, то факторы Х1 и Х2, Х1 и Х3, Х2 и Х3 тесно связаны между собой, т.е. мультиколлинеарны. Поэтому из модели надо исключить факторы Х1 и Х2 (оставили Х3 из-за того, что он наиболее тесно связан сY , чем Х2).
Построим уравнение множественной регрессии в линейной форме с полным набором немультиколлинеарных факторов (Х3, Х4) –
y = a0+a3X3+a4X4.
Используем инструмент Регрессия (анализ данных EXCEL).
Рис. 4.
Рис. 5.
Получаем:
Рис. 6.
Рис. 7.
Получили уравнение регрессии от всех немультиколлинеарных факторов (таблица 3.3., второй столбец):
y=-1.082998589+0.007797808 X3 + 0.053417176 X4
Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
Табличное значение при 5% уровне значимости и степенях свободы 25-2-1=22 составляет 2,074.
Рис. 8.
Т.к. расчетные значения: 7,10913056 >2.074$; то коэффициент а3 значим (Х3 значимо воздействует на У). Все остальные коэффициенты незначимы, т.к. tрасч<tтабл.
Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера. Доверительная вероятность p=0.95; v1=k=2;
v2=n-k-1=25-2-1=22; Fтабл= 3.44;
Рис. 9.
EMBED Equation.3 . Поскольку Fрасч>Fтабл, то уравнение регрессии следует считать адекватным.
Значение коэффициента детерминации R2=0,718660005. Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 71,8% вариации зависимой переменной учтено в модели обусловлено влиянием факторов.
Коэффициенты эластичности:
Э3= а3 EMBED Equation.3 = 0,007797808 EMBED Equation.3 =0,5714 т.е. зависимая переменная у при изменении фактора х3 на 1% при неизменных остальных факторах в среднем увеличится на 0,571%.
Э4= а4 EMBED Equation.3 = 0,053417176 EMBED Equation.3 =1,123 т.е. зависимая переменная у при изменении фактора х4 на 1% при неизменных остальных факторах в среднем увеличится на 1,123%.
Бета-коэффициенты:
Таблица 2
EMBED Equation.3 = 0,007797808 EMBED Equation.3 , т.е. при увеличении фактора Х3 на 149,386 тыс чел. У увеличится на 0,809*1,439=1,164 млрд. долл.
EMBED Equation.3 = 0,053417176 EMBED Equation.3 , т.е. при увеличении фактора Х4 на 4,736 млрд. долл. У увеличится на 0,176*1,439=1,253 млрд. долл.
Дельта- коэффициенты:
EMBED Equation.3 - доля влияния фактора х3 в суммарном влиянии всех факторов.
EMBED Equation.3 - доля влияния фактора х4 в суммарном влиянии всех факторов.
Средняя относительная ошибка: EMBED Equation.3 Т.е. в среднем расчетные значения y отличаются от фактических значений на 52,3%.
Построим уравнение множественной регрессии в линейной форме со значимым фактором (Х3)-
у=а0+а3Х3.
Используем инструмент регрессии.
Рис. 10
Рис. 11.
Получаем:
Рис. 12.
Рис. 13.
Получили уравнение регрессии от значимого фактора Х3:
у=0,646798516+0,007992871* Х3
Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
Табличное значение при 5% уровне значимости и степенях свободы 25-1-1=23 составляет 2,069.
Рис. 14.
Т.к. расчетные значения: 7,124689806 >2.069; то коэффициент а3 значим (Х3 значимо воздействует на формирование цены квартиры).
3,105043066>2.069; то коэффициент а0 значим.
Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера. Доверительная вероятность p=0.95; v1=k=1;
v2=n-k-1=25-1-1=23; Fтабл= 4,28;
Рис. 15.
EMBED Equation.3 . Поскольку Fрасч>Fтабл, то уравнение регрессии следует считать адекватным.
Значение коэффициента детерминации R2= 0, EMBED Equation.3 . Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 68,8% вариации зависимой переменной учтено в модели обусловлено влиянием факторов.
Проверку независимости проведем с помощью d-критерия Дарбина-Уотсона.
Таблица. 3.
d= EMBED Equation.3 = EMBED Equation.3 , т.к. 2,20>2, то имеет место отрицательная автокорреляция.
d` = 4-2,20=1,8 В качестве критических табличных уровней при n=25 и 1 объясняющего фактора при уровне значимости в 5% возьмем величины d1=1.29 и d2=1,45. Т.к. 1,45<1,8<2, то свойство независимости выполняется.
упрогнозное=0,646798516+0,007992871*745*0,8=5,41 млрд. долл.
Найдем верхнюю у^прог+ EMBED Equation.3 границу прогноза, где
EMBED Equation.3 ;
EMBED Equation.3 .
Получаем: EMBED Equation.3 ;
ta=0,05; k=25-2= 2.069 и EMBED Equation.3 , тогда
EMBED Equation.3
Нижняя граница: 5,41-1,959=3,451.
Верхняя граница: 5,41+1,959=7,369.