МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
EMBED MSPhotoEd.3 ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА ЭКОНОМИКО-МАТЕМАТИЧЕСКИХ МЕТОДОВ И МОДЕЛЕЙ
Л А Б О Р А Т О Р Н А Я Р А Б О Т А
по э к о н о м е т р и к е
Вариант 6
Выполнил:
студент III курса 564648647847654
Ф.И.О.
специальность ФК (дневная гр.)
Проверил:
должность доц. Уродовских В. Н.
__________________
подпись
Липецк 2008
Задача: Анализ деятельности предприятий одной отрасли РФ-2
По данным, приведённым в табл. 1. (n = 25), изучается зависимость объёма выпуска продукции Y (млн. руб.) от следующих факторов (переменных):
Таблица 1
Задание:
1. Построить матрицу парных коэффициентов корреляции. Установить, какие факторы мультиколлинеарны.
2. Построить уравнение множественной регрессии в линейной форме с полным набором факторов.
3. Оценить статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.
4. Построить уравнение регрессии со статистически значимыми факторами. Оценить качество уравнения регрессии с помощью коэффициента детерминации.
5. Рассчитать прогнозные значения результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
Решение:
1. Построим матрицу парных коэффициентов корреляции и установим, какие факторы мультиколлинеарны:
Для этого воспользуемся функцией Корреляция в Excel:
Рис. 1
Рис. 2
Таблица 2
Матрица парных коэффициентов
Анализ матрицы парных коэффициентов корреляции показывает, что зависимая переменная, т. е. объём выпуска продукции (млн. руб.), имеет тесную связь с X1 (численность промышленно-производственного персонала, чел.) ( EMBED Equation.3 = 0,99558), с X2 (среднегодовая стоимость основных фондов, млн. руб.) ( EMBED Equation.3 =0,9559). Однако факторы Х1 и Х2 тесно связаны между собой ( EMBED Equation.3 = 0,9488), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных в модели оставим Х1 – численность промышленно-производственного персонала, чел.
2. Построим уравнение множественной регрессии в линейной форме с полным набором факторов:
Для этого воспользуемся функцией Регрессия в Excel:
Рис. 3
Рис. 4
Рис. 5
Из таблицы Вывод итогов (графа «коэффициенты») получаем следующее линейное уравнение множественной регрессии с полным набором факторов:
у = 21,7х1 + 0,07х2 + 797,52х3 + 207,07х4 – 690,73х5 + 2,18х6 – 84588,94
3. Оценим статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.
Для этого воспользуемся таблицей Вывод итогов (рис. 5):
Оценим качество полученного уравнения регрессии с использованием индекса корреляции R и коэффициента детерминации R2:
Индекс корреляции R = 0,9984 – он показывает тесноту связи зависимой переменной Y с включёнными в модель объясняющими факторами. Следовательно связь между результатом У и факторами Х1, Х2, Х3, Х4, Х5 и Х6 достаточно сильная.
Коэффициент детерминации R2 = 0,9968 - показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99% вариации зависимой переменной учтено в модели и обусловлено влиянием включённых факторов.
Оценим статистическую значимость уравнения регрессии, используя критерий Фишера F (? = 0,05): Рассчитаем F-критерий Фишера и оценим качество всего уравнения в целом:
EMBED Equation.3 = 7164,5
Сравним с табличным значением:
Fтабл = 2,661 при ? = 0,05 k1 = 5 (m - 1) и k2 = 19 (n - m)
Таким образом, Fнабл > Fтабл (7164,5 > 2,74). Следовательно, качество и статистическая значимость нашего уравнения доказаны.
Оценим статистическую значимость параметров регрессии по критерию Стьюдента: для этого воспользуемся нашей таблицей Вывод итогов (рис. 5):
Мы видим в разделе t-статистика следующие значения:
tа0 = 3,491
tа1 = 19,923
tа2 = 1,905
tа3 = 1,773
tа4 = 0,946
tа5 = 0,791
tа6 = 3,549
Сравним полученные значения t-критерия с табличным:
tтабл = 2,069 (? = 0,05 и n - 2)
Т.е. tа0 > tтабл (3,491 > 2,069), tа1 > tтабл (19,923 > 2,069), tа2 < tтабл (1,905 < 2,069), tа3 < tтабл (1,773 < 2,069), tа4 < tтабл (0,946 < 2,069), tа5 < tтабл (0,791 < 2,069) и tа6 > tтабл (3,549 > 2,069).
Следовательно, параметры a0, a1 и a6 – значимы (существенны), а параметры a2, a3, a4, a5 – не значимы.
4. Построим уравнение регрессии со статистически значимыми факторами. Для этого воспользуемся функцией Регрессия в Excel:
Рис. 6
Рис. 7
Получим следующее уравнение регрессии:
у = 23,62х1 + 2,16 х2 – 47577,64
Оценим качество уравнения регрессии с помощью коэффициента детерминации:
Коэффициент детерминации R2 = 0,9953 - показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99% вариации зависимой переменной учтено в модели и обусловлено влиянием включённых факторов, что свидетельствует о высоком качестве нашей модели.
5. Рассчитаем прогнозные значения результата, если прогнозные значения факторов составляют 80% от их максимальных значений:
x1прогн = 80% *52412 = 41929,6
x2прогн = 80% *47318= 37854,4
упрогн = 23,62*41929,6 + 2,16*37854,4 – 47577,64 = 1 024 565,016
Рассчитаем доверительный интервал, в который с вероятностью 90% попадёт прогнозное значение упрогн :
EMBED Equation.3 EMBED Equation.3
где EMBED Equation.3
St = EMBED Equation.3 = 22221,412
tkp = 2,819 (tkp получено с помощью функции СТЬЮДРАСПОБР (0,01;22) для выбранной вероятности 90 % с числом степеней свободы, равным 22)
l = 1
EMBED Equation.3 =
EMBED Equation.3 =
U1 = 27500,91
Верхняя граница упрогн = 1024565,016 + 27500,91 = 1052065,93
Нижняя граница упрогн = 1024565,016 – 27500,91 = 997064,1
Представим графически: фактические, модельные значения и точки прогноза: