ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
ГОУ ВПО
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
ЯРОСЛАВСКИЙ ФИЛИАЛ
Контрольная работа
по дисциплине «Эконометрика»
Вариант №20
Ярославль 2009
Задание I.
Таблица 1
Значения исходных данных
определить наличие тренда Y(t);
построить линейную модель EMBED Equation.3 , параметры которой оценить с помощью МНК;
оценить адекватность построенной модели на основе исследования:
случайности остаточной компоненты по критерию пиков;
независимости уровней ряда остатков по d-критерию (в качестве критических использовать уровни EMBED Equation.3 и EMBED Equation.3 ) или по первому коэффициенту корреляции, критический уровень которого r(1) = 0,36;
нормальности распределения остаточной компоненты по R/S-критерию с критическими уровнями 2,7 – 3,7;
для оценки точности модели использовать среднеквадратическое отклонение и среднюю по модулю относительную ошибку;
построить точечный и интервальный прогнозы на два шага вперед (для вероятности Р=70% используйте коэффициент EMBED Equation.3 EMBED Equation.3 ;
Решение.
1. Определение наличия тренда Y(t)
Динамический ряд Y(t) является временным, так как изменение экономического показателя Y происходит в зависимости от времени t.
Если во временном ряду проявляется длительная тенденция изменения экономического показателя, то в этом случае говорят о наличии тренда.
Под трендом понимается изменение, определяющее общее направление развития, т.е. основная тенденция изменения временного ряда.
Для определения тренда в исходном временном ряду применяем метод проверки разностей средних уровней. Разобьем динамический ряд Y(t) на две части, каждая из которых представляет собой самостоятельную выборочную совокупность, имеющую нормальное распределение:
(Y1…Y4) – n1 = 4,
(Y5…Y9) – n2 = 5,
где Y1…Y5 - уровни ряда;
n1, n2 - число уровней ряда.
Таблица 2
Группы динамического ряда
Принимаем нулевую гипотезу о равенстве средних уровней двух нормально распределенных совокупностей. По каждой части ряда рассчитаем значение среднего уровня и дисперсию.
Значения средних уровней рассчитаем по формулам:
EMBED Equation.3 , EMBED Equation.3 .
EMBED Equation.3 ; EMBED Equation.3
Дисперсии ля каждой части ряда рассчитаем по формулам:
EMBED Equation.3 , EMBED Equation.3 .
EMBED Equation.3 .
EMBED Equation.3
Проверяем однородность дисперсии для первой и второй групп наблюдения. Рассчитаем F-критерий Фишера по формуле:
EMBED Equation.3 ; EMBED Equation.3 .
По таблице «Значения F-критерия Фишера при уровне значимости a = 0,05» определяем табличное значение критерия Фишера EMBED Equation.3. Поскольку EMBED Equation.3 ( 0,5>0,1, дисперсии не однородны (статистически не равны),т.е. различаются значительно, и расхождение между ними носит закономерный характер.
Проверяем гипотезу о равенстве средних уровней (отсутствие тренда): EMBED Equation.3.
Рассчитаем среднее квадратическое отклонение для всего ряда по формуле:
EMBED Equation.3, EMBED Equation.3.
Рассчитаем t-критерий Стьюдента по формуле:
EMBED Equation.3, EMBED Equation.3
По таблице «Значения t-критерия Стьюдента при уровне значимости 0,05» на основе заданной вероятности 0,95 и числа степеней свободы n-2 (9-2=7) определяем табличное значение t-критерия Стьюдента: EMBED Equation.3. Расчетное значение превышает табличное, следовательно нулевая гипотеза отвергается.
Определение наличия тренда в исходном временном ряду можно осуществить с помощью Пакета анализа данных в MS Excel
Производим ввод исходных данных. На основании исходных данных строим поле корреляции и добавляем линию тренда (рис.1):
в главном меню выбираем, Вставка/Диаграмма и строим поле корреляции;
в области построения диаграммы выделяем график, нажимаем правую кнопку мыши и из контекстного меню выбираем команду Добавить линию тренда;
EMBED Excel.Chart.8 \s в диалоговом окне Линия тренда на вкладке Тип выбираем Линейная, на вкладке Параметры выбираем Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации EMBED Equation.3.
Рис.1. Определение наличия тренда.
Из графика динамического ряда Y(t) видно наличие возрастающей тенденции, что может свидетельствовать о возможности существования линейного тренда.
Для определения наличия тренда в исходном временном ряду применяем метод проверки разностей средних уровней, для чего разбиваем динамический ряд Y(t) на две самостоятельно выбранные совокупности (Рис. 2).
С помощью Пакета анализа данных в MS Excel определяем F-критерий Фишера и проводим двухвыборочный t-тест с одинаковыми дисперсиями.
Для этого:
в главном меню выбираем Сервис/Анализ данных/ Двухвыборочный F-тест для дисперсии (рис.2). Щелкаем по кнопке ОК.
заполняем формы в диалоговом окне Двухвыборочный F-тест для дисперсии (рис. 3): интервал переменной 1 - $B$3:$В$6 , интервал переменной 2 -$В$7:$В$11; уровень значимости Альфа 0,05. Щелкаем ОК.
Получаем результаты расчета Двухвыборочного F-теста для дисперсии (табл. 3).
Рис.2. Анализ данных Двухвыборочный F-тест для дисперсии.
Рис. 3. Двухвыборочный F-тест для дисперсии
Таблица 3
Двухвыборочный F-тест для дисперсии
Сравниваем значение F=0,509 c критическим значением F=0,109 т.к. F=0,509 больше, чем F критическая, то дисперсия не однородная.
Аналогично с помощью Пакета анализа данных в MS Excel проводим двухвыборочный
t-тест с одинаковыми дисперсиями:
в главном меню выбираем Сервис/Анализ данных/Двухвыборочный t-тест с одинаковыми дисперсиями (рис.4). Щелкаем по кнопке ОК.
Рис.4. Анализ данных Двухвыборочный t-тест с одинаковыми дисперсиями.
заполняем формы в диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями (рис.5): интервал переменной 1-$В$3:$В$6, интервал переменной 2 - $В$7:$В$11; уровень значимости Альфа 0,05. Щелкаем по кнопке ОК.
Рис. 5 Двухвыборочный t-тест с одинаковыми дисперсиями
Сравниваем средние значения полученные в двух группах.
Таблица 4
Двухвыборочный t-тест с одинаковыми дисперсиями
Вывод: рассчитанное значение t-критерия по модулю приблизительно равно 3, а табличное значение t-критерия Стьюдента равно приблизительно 2,36. Расчетное значение больше табличного, и среднее значение в группах отличается существенно друг от друга, т.е. признается наличие тренда.
2. Построение линейной модели EMBED Equation.3
Линейная модель регрессии описывается уравнением вида:
EMBED Equation.3,
гдеEMBED Equation.3 - постоянная величина (свободный член уравнения);
EMBED Equation.3- коэффициент регрессии.
Построение этой модели сводится к определению параметров EMBED Equation.3 и EMBED Equation.3 по существующим исходным данным.
Классический подход при определении параметров EMBED Equation.3 и EMBED Equation.3, при которых сумма квадратов отклонений фактических значений EMBED Equation.3 от расчетных EMBED Equation.3 была бы минимальной:
EMBED Equation.3,
EMBED Equation.3
Таким образом, решается задача оптимизации:
EMBED Equation.3 и EMBED Equation.3.
Исходя из этих двух условий, получается система нормальных уравнений:
EMBED Equation.3.
Откуда
EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 EMBED Equation.3EMBED Equation.3EMBED Equation.3
где EMBED Equation.3- средние значения;
EMBED Equation.3 - текущие значения;
n - число уровней ряда.
Построим линейную модель регрессии EMBED Equation.3.
Получим параметры линейной модели регрессии с помощью инструмента Регрессии Пакета анализа данных в MS Excel.
Для этого:
в главном меню выбираем Сервис/Анализ данных/ Регрессия (рис. 6). Щелкаем по кнопке ОК.
заполняем формы в диалоговом окне Регрессия (рис.7): входной интервал Y - $C$3$C$11, входной интервал Х - $В$3$В$11; параметры вывода – Новый рабочий лист; в поле Остатки ставим необходимые флажки. Щелкаем по кнопке ОК.
Рис.6. Анализ данных.
Рис.7. Регрессия
Получаем результаты расчета Регрессии (таблица5).
Таблица 5
Вывод: полученная модель имеет вид EMBED Equation.3
3. Оценка адекватности уравнения модели.
Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна. Под адекватностью понимается соответствие модели исследуемому процессу, т.е. наблюдается соответствие значений определенных по кривой роста, EMBED Equation.3 фактическим данным EMBED Equation.3 .
Модель является адекватной, если значения остаточной последовательности EMBED Equation.3 удовлетворяют ряду требований:
значения остаточной последовательности EMBED Equation.3 должны быть случайными величинами;
значения остаточной последовательности должны быть независимыми случайными величинами, т.е. не должно наблюдаться автокорреляции в остаточной последовательности.
значение EMBED Equation.3 должны быть распределены по нормальному закону;
Математическое ожидание значений остаточной последовательности должно быть близким к нулю.
а) оценка случайности остаточной компоненты по критерию пиков.
Для оценки случайности остаточной компоненты построенной модели исследуем ряд остатков отклонений расчетных значений EMBED Equation.3 от фактических EMBED Equation.3 . Для этого проведем предварительные расчеты, результаты которых приведены в таблице 6.
Таблица 6
Расчет остатков регрессионной модели
Определим количество поворотных точек, т.е. таких точек, значение уровня в которых одновременно больше соседних с ним или наоборот, одновременно меньше предыдущего и последующего за ним уровня.
Введем обозначения: 1 – точка поворота; 0 – отсутствие точки поворота.
Из расчета (таблица 6) и графика остатков (рис.8) видно, что количество поворотных точек р=4.
Рис. 8. График остатков.
Критическое число поворотных точек определяется по формуле:
EMBED Equation.3,
EMBED Equation.3
Вывод: т.к. фактическое значение поворотных точек р=4 больше, чем критическое значение ркрит=2, то значения остаточной последовательности можно считать случайными величинами. Модель по критерию случайности адекватна.
б) оценка независимости уровней ряда остатков по d-критерию.
Процедура представляет проверку отсутствия автокорреляции в остаточной последовательности и осуществляется по d-критерию Дарбина-Уотсона:
EMBED Equation.3,
По данным таблицы 6:
EMBED Equation.3
Вывод: т.к. D>1,08 то можно считать, что модель по данному критерию адекватна.
в) оценка нормальности распределения остаточной компоненты по R/S-критерию.
Метод проверки нормальности распределения остаточной компоненты основан на R/S-критерии. Значение этого критерия численно равно отношению размаха случайной величины R к стандартному отклонению EMBED Equation.3:
EMBED Equation.3
EMBED Equation.3 EMBED Equation.3
где
EMBED Equation.3 и EMBED Equation.3 -максимальный и минимальный уровни ряда остатков;
EMBED Equation.3- среднеквадратическое отклонение;
EMBED Equation.3 - среднее значение ряда остатков;
n - количество уровней ряда.
Берем значения из таблицы 6: EMBED Equation.3=2,23 , EMBED Equation.3
Тогда
EMBED Equation.3
Найдем R= EMBED Equation.3 =2,23-(-2,22)=4,45
EMBED Equation.3
Так как R/S=3,017 EMBED Equation.3 [2,7 - 3,7], то модель адекватна по R/S-критерию.
Общие выводы:
- линейная трендовая модель является адекватной фактическому ряду динамики;
- модель может быть использована для построения прогнозных оценок.
4. Оценка точности модели.
Точность модели характеризуется величиной отклонения фактического уровня временного ряда и его оценкой, полученной расчетным путем, с использованием трендовой модели.
В качестве статистических показателей точности применяются среднеквадратическое отклонение и средняя относительная по модулю ошибка аппроксимации.
Среднеквадратическое отклонение определяется по формуле:
EMBED Equation.3
Так как EMBED Equation.3, то из таблицы 6 видно, что EMBED Equation.3 .
Тогда EMBED Equation.3.
Средняя относительная по модулю ошибка аппроксимации определяется по формуле EMBED Equation.3 . Получаем EMBED Equation.3 . Таким образом EMBED Equation.3 .
Вывод: модель имеет достаточную точность и может быть использована для оценочных расчетов прогноза.
5. Точечный и интервальный прогнозы
Для периода упреждения на EMBED Equation.3 шаг вперед
EMBED Equation.3
Для периода упреждения на EMBED Equation.3 шага вперед
EMBED Equation.3
Подставив найденные значения EMBED Equation.3 в линейную модель EMBED Equation.3, получим точечные прогнозные значения:
EMBED Equation.3
EMBED Equation.3.
Интервальный прогноз рассчитывается по формуле:
EMBED Equation.3
где доверительный интервал
EMBED Equation.3 .
Тогда при табличном значении критерия Стьюдента EMBED Equation.3
для EMBED Equation.3 EMBED Equation.3
для EMBED Equation.3 EMBED Equation.3 .
Интервальный прогноз на два шага вперед при уровне вероятности P = 70%
EMBED Equation.3 , EMBED Equation.3
Результаты прогнозных оценок по модели представлены в таблице 7.
Таблица 7
Прогнозные оценки по уравнению регрессии
Результаты прогнозирования с помощью инструмента Регрессии Пакета анализа данных в MS Excel представлены в табл.8 и на рис.9
Таблица 8
EMBED Excel.Chart.8 \s
Рис.9. Прогнозирование по линейной модели
Задание II
Таблица 9
Построить матрицу коэффициентов парной корреляции EMBED Equation.3 с EMBED Equation.3 и EMBED Equation.3 , выбрать фактор, EMBED Equation.3 наиболее тесно связанный с зависимой переменной EMBED Equation.3 ;
Построить линейную однопараметрическую модель регрессии EMBED Equation.3 ;
Оценить качество построенной модели, исследовав ее адекватность и точность;
Для модели регрессии рассчитать коэффициент эластичности и EMBED Equation.3 -коэффициент;
Построить точечный и интервальный прогнозы на два шага вперед по модели регрессии (для вероятности Р=70% использовать коэффициент EMBED Equation.3 ). Прогнозные оценки фактора EMBED Equation.3 на два шага вперед получить на основе среднего прироста от фактически достигнутого уровня.
Решение.
1. Матрица коэффициентов парной корреляции EMBED Equation.3 с EMBED Equation.3 и EMBED Equation.3
На основании анализа матрицу коэффициентов парной корреляции определяют взаимную зависимость переменных.
Выборочный парный линейный коэффициент корреляции рассчитывается по формуле:
EMBED Equation.3 .
Промежуточные результаты расчетов для коэффициентов приведены в таблице 10.