ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВОЭКОНОМИЧЕСКИЙ ИНСТИТУТ
Филиал в г. Брянске

АУДИТОРНАЯ РАБОТА
по дисциплине
ЭКОНОМЕТРИКА
ВАРИАНТ №3


ВАРИАНТ 3
По данным, представленным в табл. 3, изучается зависимость индекса человеческого развитияСпециальный индекс человеческого развития, который объединяет три показателя (валовой внутренний продукт на душу населения, грамотность и продолжительность предстоящей жизни) и дает обобщенную оценку человеческого прогресса. Впервые данный показатель был предложен в 1990 г. группой исследователей Программы развития ООН.
Y от переменных:
X1 — ВВП 1997 г., % к 1990 г.;
Х2 — расходы на конечное потребление в текущих ценах, % к ВВП;
X3 — расходы домашних хозяйств, % к ВВП;
Х4 — валовое накопление, % к ВВП;
Х5 — суточная калорийность питания населения, ккал на душу населения;
Х6 — ожидаемая продолжительность жизни при рождении 1997 г., лет.
Таблица 3

Задание
Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны.
Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.
Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.
Отберите информативные факторы по пунктам 1 и 3. Постройте уравнение регрессии со статистически значимыми факторами.
Проверьте выполнение предпосылок метода наименьших квадратов, в том числе, проведите тестирование ошибок уравнения множественной регрессии на гетероскедастичность.
РЕШЕНИЕ.
Для решения задачи используется табличный процессор MS Excel.
1. С помощью надстройки «Анализ данных… Корреляция» строим матрицу парных коэффициентов корреляции между всеми исследуемыми переменными (меню «Сервис» ? «Анализ данных…» ? «Корреляция»). На рис. 1 изображена панель корреляционного анализа программного средства. Результаты корреляционного анализа приведены в табл. 1.

рис. 1. Панель корреляционного анализа в MS Excel
Таблица 1
Матрица парных коэффициентов корреляции
Анализ значений парных коэффициентов корреляции между факторами Х1, Х2, …, Х6 показывает, что только коэффициент корреляции между парой факторов Х1–Х4 превышает по абсолютной величине 0,8 (выделен в таблице заливкой). Факторы Х1–Х4, таким образом, признаются коллинеарными.
2. С помощью надстройки «Анализ данных… Регрессия» программного средства строим линейное уравнение множественной регрессии с полным перечнем факторов (меню «Сервис» ? «Анализ данных…» ? «Регрессия»). Панель регрессионного анализа изображена на рис. 2.

Рис. 2. Панель регрессионного анализа модели с полным перечнем факторов
Результаты регрессионного анализа приведены в прил. 2 и перенесены в табл. 2. Уравнение регрессии с полным перечнем факторов имеет вид:
EMBED Equation.3 .
Таблица 2
Результаты регрессионного анализа модели с полным перечнем факторов
3. Проверим статистическую значимость уравнения регрессии. Табличное значение F-критерия Фишера можно определить с помощью встроенной функции MS Excel «FРАСПОБР», которая имеет следующий синтаксис:
=FРАСПОБР(«Уровень значимости ?»;«dfрег»;«dfост»)
Для уровня значимости ?=0,05 и чисел степеней свободы числителя (регрессии) EMBED Equation.3 (где p=6 — число факторов в модели) и знаменателя (остатка) EMBED Equation.3 табличное значение
F-критерия Фишера составляет Fтабл=3,00.
Видно, что расчетное значение F-статистики Фишера
EMBED Equation.3
превышает табличное (см. «F» в табл. 2), что свидетельствует о статистической значимости уравнения регрессии в целом. На этот же факт указывает и то, что вероятность случайного формирования уравнения регрессии в том виде, в каком оно имеется, составляет 1,63?10-9 (см. «Значимость F» в табл. 2), что ниже допустимого уровня значимости ?=0,05.
Проверим статистическую значимость коэффициентов уравнения регрессии при факторах Х1, Х2, …, Х6 с помощью t-критерия Стьюдента:
EMBED Equation.3
Табличное значение t-критерия Стьюдента можно определить с помощью встроенной функции MS Excel «СТЬЮДРАСПОБР»:
=СТЬЮДРАСПОБР(«Уровень значимости ?»;«dfост»)
Для уровня значимости ?=0,05 и числа степеней свободы остатка df=dfост=12 табличное значение t-критерия Стьюдента составляет 2,179. Анализ данных в табл. 2 показывает, что табличное значение tкритерия Стьюдента превышают по абсолютной величине t-статистики коэффициентов при факторах Х1, Х3, и эти коэффициенты признаются статистически значимыми. На этот же факт указывают и значения вероятности случайного формирования коэффициентов, которые ниже допустимого уровня значимости ?=0,05 (см. «P-Значение» в табл. 2).
Что касается факторов Х2, Х4, Х5 и Х6 (выделены в табл. 2 заливкой), то tстатистики их коэффициентов меньше по абсолютной величине табличного значения t-критерия Стьюдента, а «P-Значение» выше уровня значимости ?=0,05. Таким образом эти коэффициенты не являются статистически значимыми.
4. По результатам проверки статистической значимости коэффициентов уравнения регрессии Y=f(X1, X2, X3, X4, X6), проведенной в предыдущем пункте, строим новую регрессионную модель, содержащую только информативные факторы. Такими факторами будем считать либо факторы, коэффициенты при которых статистически значимы, либо факторы, у коэффициентов которых tстатистика превышает по абсолютной величине единицу (другими словами, абсолютная величина коэффициента больше его стандартной ошибки). К первой группе относятся факторы Х1, Х2, Х6, ко второй — фактор X4. Фактор X3 исключается из рассмотрения как неинформативный (?tb4?<1), и окончательно регрессионная модель будет содержать факторы X1, X2, X4, X6.

Для построения уравнения регрессии Y=f(X1, X2, X4, X6) скопируем на чистый рабочий лист MS Excel значения переменных Y, X1, X2, X4, X6
(прил. 5). Проводим регрессионный анализ (рис. 3). Его результаты приведены в прил. 5 и перенесены в табл. 2. Само уравнение регрессии имеет вид:
EMBED Equation.3 .

рис. 4. Панель регрессионного анализа модели Y=f(X1, X2, X4, X6)
Таблица 3
Результаты регрессионного анализа модели Y=f(X1, X2, X4, X6).
Уравнение регрессии статистически значимо в целом. Вероятность его случайного формирования ниже допустимого уровня значимости ?=0,05 (см. «Значимость F» в табл. 3).
Статистически значимыми являются коэффициенты при факторах Х2, Х3, Х6: вероятность их случайного формирования ниже допустимого уровня значимости ?=0,05 (см. «P-Значение» в табл. 3). Это свидетельствует о существенном влиянии изменения данных факторов на изменение годовой прибыли Y.
Коэффициент при факторе Х1 (выделен в табл. 3 заливкой) не является статистически значимым. Однако этот фактор можно считать информативным, так как tстатистика его коэффициента превышает по абсолютной величине единицу, хотя к дальнейшим выводам относительно фактора Х1 следует относиться с некоторой осторожностью.