ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВОЭКОНОМИЧЕСКИЙ ИНСТИТУТ
Филиал в г. Брянске

КОНТРОЛЬНАЯ РАБОТА
по дисциплине
ЭКОНОМЕТРИКА


Брянск — 2009
Вариант 3
ЗАДАНИЕ
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпускаемой продукции (Y, млн. руб.) от объема капиталовложений (X, млн. руб.):
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию углового коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; определить стандартную ошибку регрессии; построить график остатков.
Проверить выполнение предпосылок метода наименьших квадратов.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (уровень значимости ?=0,05).
Вычислить коэффициент детерминации R2; проверить значимость уравнения регрессии с помощью F-критерия Фишера (уровень значимости ?=0,05); найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование значения показателя Y при уровне значимости ?=0,1, если прогнозное значения фактора Х составит 80 % от его максимального значения.
Представить графически: фактические и модельные значения Y, точки прогноза.
Составить уравнения нелинейной регрессии:
логарифмической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
РЕШЕНИЕ
Для решения задачи используется табличный процессор EXCEL.
1. С помощью надстройки «Анализ данных» проводим регрессионный анализ и определяем параметры уравнения линейной регрессии EMBED Equation.3 (меню «Сервис» ? «Анализ данных…» ? «Регрессия»):

В результате этого уравнение регрессии будет иметь вид:
EMBED Equation.3 (прил. 1).
Угловой коэффициент b1=1,32 показывает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпускаемой продукции Y возрастает в среднем на 1,32 млн. руб.
2. При проведении регрессионного анализа в EXCEL одновременно были определены остатки регрессии EMBED Equation.3 (i=1, 2, …, n, где n=10 — число наблюдений значений переменных X и Y) (см. «Вывод остатка» в прил. 1) и рассчитана остаточная сумма квадратов
EMBED Equation.3 (см. «Дисперсионный анализ» в прил. 1).
Стандартная ошибка линейной парной регрессии Sрег определена там же:
EMBED Equation.3 млн. руб.
(см. «Регрессионную статистику» в прил. 1).
Стандартная ошибка регрессии Sрег показывает, что фактические значения объема выпускаемой продукции Y отличается от расчетных значений в среднем на 3,101 млн. руб.
График остатков ei от предсказанных уравнением регрессии значений результата EMBED Equation.3 (i=1, 2, …, n) строим с помощью «Мастера диаграмм». Предварительно в «Выводе остатка» в прил. 1 выделяются блоки ячеек «Предсказанное Y» и «Остатки» вместе с заголовками, а затем выбирается пункт меню «Вставка» ? «Диаграмма…» ? «Точечная»:

График остатков приведен в прил. 2
3. Проверим выполнение предпосылок обычного метода наименьших квадратов.
1) Случайный характер остатков. Визуальный анализ графика остатков не выявляет в них какой-либо явной закономерности.
Проверим исходные данные на наличие аномальных наблюдений (выбросов) объема выпускаемой продукции Y. С этой целю сравним абсолютные величины стандартизированных остатков (см. «Вывод остатка» в прил. 1) с табличным значением t-критерия Стьюдента для уровня значимости ?=0,05 и числа степеней свободы EMBED Equation.3 , которое составляет tтаб=2,306 (см. Справочные таблицы).
Видно, что ни один из стандартизированных остатков не превышает по абсолютной величине табличное значение t-критерия Стьюдента. Это свидетельствует об отсутствии выбросов.
2) Нулевая средняя величина остатков. Данная предпосылка всегда выполняется для линейных моделей со свободным коэффициентом b0, параметры которых оцениваются обычным методом наименьших квадратов. В нашей модели алгебраическая сумма остатков и, следовательно, их среднее, равны нулю: EMBED Equation.3 (см. прил. 1).
Для вычисления суммы и среднего значений остатков использовались встроенные функции «СУММ» и «СРЗНАЧ».
3) Одинаковая дисперсия (гомоскедастичность) остатков. Выполнение данной предпосылки проверим методом Глейзера в предположении линейной зависимости среднего квадратического отклонения случайной составляющей регрессионной модели от значений факторов. Для этого рассчитывается коэффициент корреляции EMBED Equation.3 между абсолютными величинами остатков EMBED Equation.3 и значениями EMBED Equation.3 (i=1, 2, …, n) с помощью выражения, составленного из встроенных функций:
=КОРРЕЛ(ABS(Остатки);Предсказанное_Y)
Коэффициент корреляции оказался равным EMBED Equation.3 (см. прил. 1).
Критическое значение коэффициента корреляции для уровня значимости ?=0,05 и числа степеней свободы EMBED Equation.3 составляет rкр=0,632 (см. Справочные таблицы,1).
Так как коэффициент корреляции EMBED Equation.3 не превышает по абсолютной величине критическое значение, то статистическая гипотеза об одинаковой дисперсии остатков не отклоняется на уровне значимости ?=0,05.
4) Отсутствие автокорреляции в остатках. Выполнение данной предпосылки проверяем методом Дарбина–Уотсона. Предварительно ряд остатков упорядочивается в зависимости от последовательно возрастающих значений результата Y, предсказанных уравнением регрессии. Для этой цели в «Выводе остатка» в прил. 1 выделяется любая ячейка в столбце «Предсказанное Y», и на панели инструментов нажимается кнопка «» («Сортировка по возрастанию»). По упорядоченному ряду остатков рассчитываем dстатистику Дарбина–Уотсона
EMBED Equation.3 (см. прил. 1).
Для расчета dстатистики использовалось выражение, составленное из встроенных функций EXCEL:
=СУММКВРАЗН(«Остатки 2, …, n»; «Остатки 1, …, n–1»)/СУММКВ(«Остатки 1, …,n»)
Критические значения dстатистики для числа наблюдений n=10, числа факторов p=1 и уровня значимости ?=0,05 составляют: d1=0,88; d2=1,32 (см. Справочные таблицы,5).
Так как выполняется условие
EMBED Equation.3 ,
статистическая гипотеза об отсутствии автокорреляции в остатках является положительной на уровне значимости ?=0,05.
Примечание:
если EMBED Equation.3 , то остатки признаются независимыми (некоррелированными);
если EMBED Equation.3 — имеется положительная автокорреляция;
если EMBED Equation.3 — существует отрицательная автокорреляция;
если EMBED Equation.3 или EMBED Equation.3 , то это указывает на неопределенность ситуации.
Проверим отсутствие автокорреляции в остатках также и по коэффициенту автокорреляции остатков первого порядка
EMBED Equation.3 (см. прил. 1).
(ряд остатков упорядочен в той же самой последовательности).
Для расчета коэффициента автокорреляции использовалось выражение, составленное из встроенных функций:
=СУММПРОИЗВ(«Остатки 2, …, n»; «Остатки 1, …, n–1»)/СУММКВ(«Остатки 1, …,n»)
Критическое значение коэффициента автокорреляции для числа наблюдений n=10 и уровня значимости ?=0,05 составляет r(1)кр=0,632 (см. Справочные таблицы,1). Так как коэффициент автокорреляции остатков первого порядка не превышает по абсолютной величине критическое значение, то это еще раз указывает на отсутствие автокорреляции в остатках.
5) Нормальный закон распределения остатков. Выполнение этой предпосылки проверяем с помощью R/S-критерия, определяемого по формуле
EMBED Equation.3 ,
где emax=6,30; emin=(–3,61) — наибольший и наименьший остатки соответственно (определялись с помощью встроенных функций «МАКС» и «МИН»; см. прил. 1); EMBED Equation.3 — стандартное отклонение ряда остатков (определено с помощью встроенной функции «СТАНДОТКЛОН»; см. прил. 1).
Критические границы R/S-критерия для числа наблюдений n=10 и уровня значимости ?=0,05 имеют значения: (R/S)1=2,67 и (R/S)2=3,69 (см. Справочные таблицы,2).
Так как расчетное значение R/S-критерия попадает в интервал между критическими границами, то статистическая гипотеза о нормальном законе распределения остатков не отклоняется на уровне значимости ?=0,05.
Таким образом, выполняются четыре из пяти предпосылок обычного метода наименьших квадратов. Это говорит о том, что регрессионная модель не вполне адекватна исследуемому экономическому явлению, и использовать ее для целей анализа и прогнозирования индекса человеческого развития следует с некоторой осторожностью.
4. Проверим статистическую значимость коэффициентов b0 и b1 уравнения регрессии. Табличное значение t-критерия Стьюдента для уровня значимости ?=0,05 и числа степеней свободы остатка линейной парной регрессии EMBED Equation.3 составляет tтаб=2,306 (см. Справочные таблицы,3).
t-статистики коэффициентов
EMBED Equation.3 ,
были определены при проведении регрессионного анализа в EXCEL: tb0?2,481; tb1?9,481 (см. прил. 1). Их анализ показывает, что по абсолютной величине все они превышают табличное значение t-критерия Стьюдента. Это свидетельствует о статистической значимости обоих коэффициентов.
Статистическая значимость углового коэффициента b1 дает основание говорить о существенном (значимом) влиянии изменения объема капиталовложений X на изменение объема выпускаемой продукции Y.
5. Коэффициент детерминации R2 линейной модели также был определен при проведении регрессионного анализа:
EMBED Equation.3
(см. «Регрессионную статистику» в прил. 1).
Значение R2 показывает, что линейная модель объясняет 91,7 % вариации объема выпускаемой продукции Y.
F-статистика линейной модели имеет значение
EMBED Equation.3
(см. «Дисперсионный анализ» в прил. 1).
Табличное значение F-критерия Фишера для уровня значимости ?=0,05 и чисел степеней свободы EMBED Equation.3 и EMBED Equation.3 составляет Fтаб=5,32 (см. Справочные таблицы, 4). Так как F-статистика превышает табличное значение F-критерия Фишера, то это свидетельствует о статистической значимости уравнения регрессии в целом.
Среднюю относительную ошибку аппроксимации определяем по приближенной формуле
EMBED Equation.3 ,
где EMBED Equation.3 млн. руб. — средний объем выпускаемой продукции, определенный с помощью встроенной функции «СРЗНАЧ» (см. «Исходные данные» в прил. 1).
Значение Еотн показывает, что предсказанные уравнением регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 4,1 %. Линейная модель имеет высокую точность (при EMBED Equation.3 — точность модели высокая, при EMBED Equation.3 — точность хорошая, при EMBED Equation.3 — удовлетворительная, при EMBED Equation.3 — неудовлетворительная).
По результатам проверок, проведенных в пунктах 3 — 5, можно сделать вывод о высоком качестве линейной модели и возможности ее использования для целей анализа и прогнозирования объема выпускаемой продукции.
6. Спрогнозируем объем выпускаемой продукции Y, если прогнозное значение объема капиталовложений X составит 80 % от своего максимального значения в исходных данных:
максимальное значение X — xmax=44 млн. руб. (см. «Исходные данные» в прил. 1);
прогнозное значение X — EMBED Equation.3 млн. руб.
Среднее прогнозируемое значение объема выпускаемой продукции (точечный прогноз) равно
EMBED Equation.3 млн. руб.
Стандартная ошибка прогноза фактического значения объема выпускаемой продукции y0 рассчитывается по формуле
EMBED Equation.3 млн. руб.,
где EMBED Equation.3 млн. руб. — средний объем капиталовложений; EMBED Equation.3 млн. руб. — стандартное отклонение объема капиталовложений (определены с помощью встроенных функций «СРЗНАЧ» и «СТАНДОТКЛОН»; см. «Исходные данные» в прил. 1).
Интервальный прогноз фактического значения объема выпускаемой продукции y0 с надежностью (доверительной вероятностью) ?=0,9 (уровень значимости ?=0,1) имеет вид:
EMBED Equation.3 млн. руб.,
где tтаб=1,860 — табличное значение t-критерия Стьюдента при уровне значимости ?=0,1 и числе степеней свободы EMBED Equation.3 (см. Справочные таблицы,3).
Таким образом, объем выпускаемой продукции Y с вероятностью 90 % будет находиться в интервале от 52,985 до 65,075 млн. руб.
7. График, на котором изображены фактические и предсказанные уравнением регрессии значения Y строим с помощью «Мастера диаграмм» (меню «Вставка» ? «Диаграмма…» ? «Точечная»). Далее строим линию линейного тренда (меню «Диаграмма» ? «Добавить линию тренда…» ? «Линейная»), и устанавливаем вывод на диаграмме уравнения регрессии и коэффициента детерминации R2:

Точки точечного и интервального прогнозов наносим на график вручную (прил. 3).
8. Логарифмическую, степенную и показательную модели также строим с помощью «Мастера диаграмм» (меню «Вставка» ? «Диаграмма…» ? «Точечная»). Далее последовательно строим соответствующие линии тренда (меню «Диаграмма» ? «Добавить линию тренда…»), и устанавливаем вывод на диаграмме уравнения регрессии и коэффициента детерминации R2:

Графики линий регрессии, уравнения регрессии и значения R2 приведены в прил. 4. Рассмотрим последовательно каждую модель.
1) Логарифмическая модель:
EMBED Equation.3 .
Значение параметра b1=46,085 показывает, что при увеличении объема капиталовложений X на 1 % объем выпускаемой продукции Y возрастает в среднем на EMBED Equation.3 млн. руб.
Коэффициент детерминации R2?0,9304 показывает, что логарифмическая модель объясняет 93,04 % вариации объема выпускаемой продукции Y.
Стандартная ошибка логарифмической регрессии также рассчитывается через коэффициент детерминации R2:
EMBED Equation.3 млн. руб.,
где EMBED Equation.3 млн. руб. — стандартное отклонение объема выпускаемой продукции, определенное с помощью встроенной функции «СТАНДОТКЛОН» (см. «Исходные данные» в прил. 1).
Среднюю относительную ошибку аппроксимации определяем по приближенной формуле
EMBED Equation.3 .
Предсказанные уравнением логарифмической регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 8,976 млн. руб. или на 12,09 %. Логарифмическая модель имеет хорошую точность.
2) Степенная модель:
EMBED Equation.3 .
Показатель степени b1=0,7997 показывает, что при увеличении объема капиталовложений X на 1 % объем выпускаемой продукции Y возрастает в среднем на 0,7997 %.
Коэффициент детерминации R2?0,9288 показывает, что степенная модель объясняет 92,88 % вариации объема выпускаемой продукции Y.
Стандартная ошибка степенной регрессии равна
EMBED Equation.3 млн. руб.
Средняя относительная ошибка аппроксимации имеет значение
EMBED Equation.3 .
Предсказанные уравнением степенной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 2,856 млн. руб. или на 3,85 %. Степенная модель имеет хорошую точность.
3) Показательная (экспоненциальная) модель:
EMBED Equation.3 ,
где е=2,718… — основание натуральных логарифмов; EMBED Equation.3 — функция экспоненты (в EXCEL встроенная функция «EXP»).
Параметр b1=1,0228 показывает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпускаемой продукции Y возрастает в среднем в 1,0228 раза, то есть на 2,28 %.
Коэффициент детерминации R2?0,9115 показывает, что показательная модель объясняет 91,15 % вариации объема выпускаемой продукции Y.
Стандартная ошибка показательной регрессии:
EMBED Equation.3 млн. руб.
Средняя относительная ошибка аппроксимации:
EMBED Equation.3 .
Предсказанные уравнением показательной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 3,06 млн. руб. или на 4,12 %. Показательная модель имеет хорошую точность.
Сравнивая между собой коэффициенты детерминации R2 четырех построенных моделей (линейной, логарифмической, степенной и показательной), можно придти к выводу, что лучшей моделью является логарифмическая модель, так как она имеет самое большое значение R2.







ПРИЛОЖЕНИЕ 1
SHAPE \* MERGEFORMAT

ПРИЛОЖЕНИЕ 2



ПРИЛОЖЕНИЕ 3


ПРИЛОЖЕНИЕ 4