Министерство образования Российской Федерации
Всероссийский заочный финансово-экономический институт
Кафедра математики и информатики
Аудиторная работа
по дисциплине «Эконометрика»
Вариант № 5
Выполнила студентка 3 курса
2 потока 1 подгруппы
Факультет: «ФиК»
Специальность: «ФиК»
№ зачетной книжки: 05ФФД40419
Бадретдинова А.Н.
Руководитель: Фархиева С.А.
Уфа 2007
Условие:
В таблице 1 представлены данные о средней ожидаемой продолжительности жизни от нескольких факторов по данным за 1995 г.
Таблица 1
Принятые в таблице обозначения:
у - средняя ожидаемая продолжительность жизни при рождении, лет;
Х2 - темпы прироста населения по сравнению с предыдущим годом, %;
Х3 - темпы прироста рабочей силы по сравнению с предыдущим годом, %;
Х4 - коэффициент младенческой смертности, %.
Задание:
Построить матрицу парных коэффициентов корреляции, оценить статистическую значимость коэффициентов корреляции. Установить, какие факторы коллинеарные.
Постройте уравнение множественной регрессии, обосновав отбор факторов.
Построить графики остатков. Сделать выводы
Проверить выполнение предпосылок МНК.
Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней ожидаемой продолжительности жизни в этом уравнении?
Постройте уравнение множественной регрессии только со статистически значимыми факторами.
7. Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
8. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (а=0,05; а =0,10).
Решение:
1) Построим матрицу парных коэффициентов корреляции с использованием инструмента Корреляция (Анализ данных в EXCEL).
Для проведения корреляционного анализа выполните следующие действия:
1. Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.
2. Выберем команду Сервис => Анализ данных.
3. В диалоговом окне Анализ данных выберем инструмент Корреляция, а затем щелкните на кнопке ОК.
4. В диалоговом окне Корреляция в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные. Если выделены и заголовки столбцов, то установите флажок Метки в первой строке.
5. Выберем параметры вывода
6. ОК.
Таблица 2
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная У коллинеарная с фактором Х4 (ryx1= -0,899).
2) Построим уравнение множественной регрессии с применением инструмента Регрессия (Анализ данных в EXCEL).
Для проведения регрессионного анализа выполните следующие действия:
1. Выберем команду Сервис => Анализ данных.
2. В диалоговом окне Анализ данных выберем инструмент Регрессия, а затем щелкнем на кнопке ОК.
3. В диалоговом окне Регрессия в поле Входной интервал Y вводим адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X вводим адреса диапазонов, которые содержат значения независимых переменных (рис. 2).
4. Установите флажок Метки в первой строке.
5. Выберите параметры вывода $B$67
6. В поле Остатки поставим необходимые флажки.
7. ОК.
Рис. 2 Диалоговое окно Регрессия подготовлено к выполнению анализа данных
Результат регрессионного анализа содержится в таблицах на рисунке 3. Рассмотрим содержание этих таблиц.
Рис.3 Регрессионный анализ
Во втором столбце таблицы 3 рисунка 3 содержатся коэффициенты уравнения регрессии а0, а2, а3 а4. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии, а в четвертом – t – статистика, используемая для проверки значимости коэффициентов уравнения регрессии.
Уравнение регрессии зависимости у развития от х1 можно записать в следующем виде:
у = 72,6 -7,76Х2 + 6,24Х3 – 0,16 Х4
Построим графики остатков.
Рис. 4. График остатков
Расчетное значение критерия пиков равно:
EMBED Equation.3
Из графика остатков видно, что количество поворотных точек равно 11, что больше критического числа поворотных точек. Модель по этому критерию адекватна. Тренд существует
Проверим выполнение предпосылок МНК.
Проверка гипотезы о близости к нулю математического ожидания остатков.
Легко из представленной таблицы убедится, что математическое ожидание ряда остатков равно нулю, т.е. |еср| = 0. Модель по этому критерию адекватна.
Соответствие ряда остатков нормальному закону распределения определим при помощи R/S–критерию с критическими уровнями 2,7 – 3,7.
Среднеквадратическое отклонение: Sе = EMBED Equation.3 = EMBED Equation.3 = 2,27
R/S = (мах e(t) - min e(t) ) / Sе = (3,35 – (-4,1))/2,27 = 3,3
Расчетное значение попадает в интервал (2,7 …3,7), следовательно, свойство нормальности распределения выполняется. Модель по этому критерию адекватна.
Оценим статистическую значимость уравнения множественной регрессии.
Рассчитаем параметры линейного уравнения множественной регрессии.
Оценка параметров регрессии осуществляется по методу наименьших квадратов по формуле 2, используя данные, приведенные в таблице 3.
А = (ХтХ)-1 Хт Y (2)
где а – подлежащий оцениванию вектор неизвестных параметров размерности (m+1)×1;
Х – матрица n наблюдений независимых переменных Х1, Х2, …, Хm, размерность матрицы Х равна n× (m+1);
Y – вектор зависимой переменной размерности n×1, представляющий собой n наблюдений значений yi.
Таблица 3
Произведение матриц ХтХ получаем с помощью функции =МУМНОЖ(B125:V128;C101:F121). Обратную матрицу определяем с помощью встроенной функции =МОБР(B120:D122).
Уравнение регрессии зависимости цены квартиры от 8 факторов можно записать в следующем виде:
у = 7,99 – 6,62Х2 + 6,53Х3 + 0,45 Х4
Значимость коэффициентов уравнения регрессии а0, а2, а3, а4 оценим с использованием t-критерия Стьюдента.
taj = aj/Saj = aj/Se x EMBED Equation.3 ,
b11 = 1,051
b22 = 0,750
b33 = 0,456
b44 = 0,0001
ta0 = 72,6 /2,5 EMBED Equation.3 = 28,8
ta2 = -7,76/2,5 EMBED Equation.3 = -3,64
ta3 = 6,24/2,5 EMBED Equation.3 = 3,76
ta4 = -0,16/2,5 EMBED Equation.3 = -5,35
Расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии приведены в четвертом столбце таблицы 13 протокола EXCEL. Табличное значение t-критерия Стьюдента можно найти с помощью функции СТЬЮДРАСПОБР (рис. 5).
Рис. 5. Определение табличного значения t-критерия Стьюдента
Табличное значение t-критерия при 5% уровне значимости и степенях свободы (21 -3 -1 = 17) составляет 2,1. Так как |tрасп|>tтабл то все коэффициенты существенны (значимы).
6) Построим уравнение множественной регрессии со статистически значимыми факторами, т.е.:
у = 7,99 – 6,62Х2 + 6,53Х3 + 0,45 Х4
7) Прогнозное значение результата, если прогнозное значение факторов составляет 80% от их максимальных значений:
Х2пр = 3,1*0,8 = 2,5
Х3пр = 4,0*0,8 = 3,2
Х4пр = 124*0,8 = 99,2
Yр(N+l) = у = 7,99 – 6,62*2,5 + 6,53*3,2 + 0,45*99,2 = 57,8
8) Для уровня значимости 5%:
Доверительный интервал прогноза будет иметь следующие границы:
Верхняя граница прогноза: Yр(N+l)+ U(1)
Нижняя граница прогноза: Yр(N+l)- U(1)
U(1) = Se tкp EMBED Equation.3 =se tкp EMBED Equation.3
S EMBED Equation.3 = 2,5
tкp = 2,2
Хпрт= (1; 2,5; 3,2; 99,2)
U(1) = 2,5*2,2* 0,494= 3,65
Для уровня значимости 10%:
Доверительный интервал прогноза будет иметь следующие границы: