Владимир 2009
Задача 1. Эконометрическое моделирование стоимости квартир в Московской области
Даны следующие исходные данные:
1. Рассчитать матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов корреляции.
2. Построить поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
3. Рассчитать параметры линейной парной регрессии для каждого фактора Х.
4. Оценить качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выбрать лучшую модель.
5. Для выбранной модели осуществить прогнозирование среднего значения показателя Y при уровне значимости ? = 0,05, если прогнозное значение фактора Y составит 80% от его максимального значения. Представить графически: фактические и модельные значения, точки прогноза.
6. Используя пошаговую множественную регрессию ( метод исключения или метод включения), построить модель формирования цены квартиры за счет значимых факторов. Дать экономическую интерпретацию коэффициентов модели регрессии.
7. Оценить качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дать оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, ?- и ? – коэффициентов.
Решение:
При решении данной задачи расчеты и построение графиков и диаграмм будем вести с использованием настройки Excel Анализ данных и программы SPSS.
1. Рассчитаем матрицу парных коэффициентов корреляции и оценим значимость коэффициентов корреляции.
Чтобы рассчитать матрицу парных коэффициентов корреляции скопируем таблицу с исходными данными в Excel. Далее воспользуемся инструментом Корреляция, входящим в настройку Анализ данных.
В диалоговом окне Корреляция в поле Входной интервал вводим диапазон ячеек, содержащих исходные данные. Так как мы выделили и заголовки столбцов, то устанавливаем флажок Метки в первой строке.
Получили следующие результаты:
Таблица 1.1.
Матрица парных коэффициентов корреляции
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная Y , т.е. цена квартиры имеет более тесную связь с Х4 (жилая площадь квартиры). Коэффициент корреляции равен 0,874. Это означает, что на 87,4 зависимая переменная Y (цена квартиры) зависит от показателя Х4 (жилая площадь квартиры). Также зависимая переменная Y (цена квартиры) имеет среднюю связь с Х2 (число комнат в квартире) и слабую связь с Х1 (город области). В то же время межфакторная связь между Х2 (число комнат в квартире) и Х4 (жилая площадь квартиры) равна 0,869 весьма тесная, что свидетельствует о наличии мультиколлинеарности. Факторы Х2 и Х4 связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга. Вследствие этого вариация в исходных данных перестает быть полностью независимой, и нельзя оценить воздействие каждого фактора в отдельности.
Статистическую значимость коэффициентов корреляции определим помощью t-критерия Стьюдента. Табличное значение сравниваем с расчетными значениями.
Вычислим табличное значение с помощью функции СТЬЮДРАСПОБР.
Tтабл.= 2,0244 при доверительной вероятности 0,05 и степенью свободы (n-2).
Статистическим значимым является фактор Х4.
2. Построим поле корреляции результативного признака (стоимости квартиры) и наиболее тесно связанного с ним фактора (жилой площади квартиры).
Для этого воспользуемся инструментом построения точечной диаграммы программы Excel.
В результате получаем поле корреляции цены квартиры, тыс. долларов и жилой площади квартиры, кв. м. (рисунок 1.1)
Рисунок 1.1.
3. Рассчитаем параметры линейной парной регрессии для каждого фактора Х.
Для расчета параметров линейной парной регрессии воспользуемся инструментом Регрессия, входящим в настройку Анализ данных.
В диалоговом окне Регрессия в поле Входной интервал Y вводим адрес диапазона ячеек, которые представляют зависимую переменную, т.е стоимость квартир. В поле Входной интервал Х вводим адрес диапазона, который содержит значения зависимых переменных (горд области, жилая площадь квартиры, число комнат в квартире). Выполним поочередно вычисления параметров парной регрессии для каждого фактора Х.
Для Х4 получили следующие данные, представленные в таблице 1.2:
Таблица 1.2
Уравнение регрессии зависимости цены квартиры от жилой площади квартиры имеет вид:
Y4 = 10,04+0,3085* Х4
Для Х2 получили следующие данные, представленные в таблице 1.3:
Таблица 1.3
Уравнение регрессии зависимости цены квартиры от числа комнат в квартире имеет вид:
Y2 = 0,9762+0,0157* Х2
Для Х1 получили следующие данные, представленные в таблице 1.4:
Таблица 1.4
Уравнение регрессии зависимости цены квартиры от города области имеет вид:
Y1 = 0,4603+1E-04x* Х1
4. Оценим качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Установим, какая модель является лучшей.
Коэффициент детерминации, среднюю ошибку аппроксимации мы получили в результате расчетов, проведенных в пункте 3. Полученные данные представлены в следующих таблицах:
Данные по Х4:
Таблица 1.5 а
Таблица 1.5 б
Данные по Х2:
Таблица 1.6 а
Таблица 1.6 б
Данные по Х1:
Таблица 1.7 а
Таблица 1.7 б
А) Коэффициент детерминации определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием не него фактора Х. Чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели.
В программе Excel обозначается R-квадрат:
Rх42 = 0,764
Rх22 = 0,564
Rх12 = 0,0001
Исходя из данного критерия наиболее адекватной является модель уравнения регрессии зависимости цены квартиры от жилой площади квартиры (Х4).
Б) Среднюю ошибку аппроксимации рассчитываем по формуле:
EMBED Equation.3 , где числитель – сумма квадратов отклонения расчетных значений от фактических. В таблицах она находится в столбце SS, строке Остатки.
Среднее значение цены квартиры EMBED Equation.3 рассчитаем в Excel с помощью функции СРЗНАЧ. EMBED Equation.3 = 103,7375 тыс. долл.
При проведении экономических расчетов модель считается достаточно точной, если средняя ошибка аппроксимации меньше 5%, модель считается приемлемой, если средняя ошибка аппроксимации меньше 15%.
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
По данному критерию, наиболее адекватной является математическая модель для уравнения регрессии зависимости цены квартиры от жилой площади квартиры (Х4).
В) Для проверки значимости модели регрессии используется F-тест. Для этого выполняется сравнение Fфакт. И и критического (табличного) Fтабл. Значений критерия Фишера.
Расчетные значения приведены в таблицах 1.5 б, 1.6 б, 1.7 б (обозначены буквой F).
Табличное значение F-критерий Фишера рассчитываем в Excel с помощью функции FРАСПОБР. Вероятность EMBED Equation.3 , число степеней свободы: f1 =2, f2 =10.
Получили: Fтабл. = 4,10
Расчетные значения критерий Фишера для каждого фактора сравним с табличным значением:
Fх4 = 122,94> Fтабл. = 4,10 модель по данному критерию адекватна.
Fх2 = 49,17> Fтабл. = 4,10 модель по данному критерию адекватна.
Fх1 = 0,0048> Fтабл. = 4,10 модель по данному критерию не адекватна.
Проанализировав данные по всем трем критериям, можно сделать вывод, что наиболее лучшей является математическая модель, построенная для фактора жилая площадь квартиры, которая описана уравнением Y4 = 10,04+0,3085* Х4
5. Для выбранной модели зависимости цены квартиры от жилой площади квартиры Y = 10,04+0,3085* Х осуществим прогнозирование среднего значения показателя Y при уровне значимости EMBED Equation.3 , если прогнозное значение фактора Х составит 80% от его максимального значения.
Рассчитаем прогнозное значение Х, по условию оно составит 80% от максимального значения.
Рассчитаем Хmax в Excel с помощью функции МАКС.
Хmax = 91 кв.м
Х41 = 0,8 * 91 = 72,8 кв.м
Для получения прогнозных оценок зависимой переменной подставим полученное значение независимой переменной в линейное уравнение:
Y41 = 10,04+0,3085* 72,8 = 32,4988 тыс.долл.
Определим доверительный интервал прогноза, который будет иметь следующие границы:
yp (N + l) + U(l)
yp (N + l) – U(l)
Для вычисления доверительного интервала для прогнозного значения, рассчитываем величину отклонения от линии регрессии. Для модели парной регрессии величина отклонения рассчитывается:
EMBED Equation.3 В результате получаем поле корреляции цены квартиры, тыс. ммы программы мой, и нельзя оценить воз Табли
EMBED Equation.3 , т.е. значение стандартной ошибки из таблицы 1.5 а.
(Так как число степеней свободы равно единице, то знаменатель будет равен n-2). EMBED Equation.3 28,20
Для расчета коэффициента EMBED Equation.3 воспользуемся функцией Excel СТЬЮДРАСПОБР, вероятность ? = 0,05, число степеней свободы: (n-2) = 40 -2 = 38. EMBED Equation.3 = 2.0244
Значение EMBED Equation.3 рассчитаем с помощью Excel, получили 15950,82
EMBED Equation.3
Определим верхнюю и нижнюю границы интервала:
32,4988 + 58 = 90,4988
32,4988 - 58 = -25,5012
Таким образом, прогнозное значение EMBED Equation.3 = 32,4988 тыс.долл., будет находиться между нижней границей, равной -25,5012 тыс.долл. и верхней границей, равной 90,4988тыс.долл.
Фактические и модельные значения, точки прогноза представлены графически на рисунке 1.2.
Рисунок 1.2
6. Используя пошаговую множественную регрессию (метод исключения), построим модель формирования цены квартиры за счет значимых факторов.
Коэффициент парной корреляции независимых переменных Х2 (число комнат в квартире) и Х4 (жилая площадь квартиры) rx2x4 = 0,868524. Так как это больше 0,8, следовательно, в исходных данных имеется мультиколлинеарность. Чтобы избавиться от мультиколлинеарности из переменных Х2 (число комнат в квартире) и Х4 (жилая площадь квартиры) оставим в модели Х4, так как он в большей степени связан с зависимой переменной Y (цена квартиры). Для построения множественной регрессии воспользуемся функцией Регрессия программы Excel, включив в нее факторы: Y, X1, X4. В результате получаем результативные таблицы, из которых нам необходим t-критерий Стьюдента.
Таблица 1.8.а
Таблица 1.8.б
Таблица 1.8.в
Получаем модель вида:
Y =2,48928Х4 +6,692936Х1 -3,9361. Поскольку Fтабл. < Fрасч. (4,10 < 61,01), уравнение регрессии следует признать адекватным.
Выберем наименьшее по модулю значение –критерия Стьюдента, оно равно | 0,73|, сравним его с табличным значением, которое рассчитаем в Excel, уровень значимости берем 0,05, число степеней свободы n – m -1 = 40 – 3 : t табл. = 2,026.
Поскольку | 0,73| < 2,026 модель следует признать не адекватной.
7. Оценка качества построенной модели.
а) Для модели Y = 2,48928Х4 +6,692936Х1 -3,9361 коэффициент детерминации составил 0,77, для модели Y4 = 10,04+0,3085* Х4 он составил 0,76 поскольку чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели, то первая модель является лучшей по данному критерию.
б) Рассчитаем среднюю ошибку аппроксимации:
EMBED Equation.3
Для предыдущей модели она составила 26,498.
в) Рассчитаем табличное значение F-критерия Фишера при вероятности 0,05,
число степеней свободы: f1 =2, f2 =10:
Fтабл. = 4,10
Fфакт. = 61,01
Fфакт. = 61,01> Fтабл. = 4,10 - модель по данному критерию адекватна.
Для оценки значимого фактора полученной математической модели, рассчитаем коэффициенты эластичности, EMBED Equation.3 и EMBED Equation.3 - коэффициенты.
Коэффициент эластичности показывает, на сколько процентов изменится результативный признак при изменении факторного признака на 1%.
EMBED Equation.3
EMBED Equation.3
То есть с ростом жилой площади квартиры на 1% стоимость квартиры возрастает в среднем на 1%.
Наибольшее воздействие на цену квартиры оказывает величина жилой площади (Х4). EMBED Equation.3 - коэффициент показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение.
EMBED Equation.3
EMBED Equation.3
Данные средних квадратических отклонений взяты из таблиц, полученных с помощью инструмента Описательная статистика.
EMBED Equation.3 - коэффициент определяет долю влияния фактора в суммарном влиянии всех факторов:
EMBED Equation.3
EMBED Equation.3
ВЫВОД:
Из полученных расчетов можно сделать вывод, что результативный признак Y (цена квартиры) на 84% зависит от фактора Х4 (жилая площадь квартиры).
Задача 2. Исследовать динамику экономического показателя на основе анализа одномерного временного ряда.
В течение девяти последовательных недель фиксировался спрос Y(t) .руб.) на кредитные ресурсы финансовой компании. Временной ряд этого показателя приведен ниже в таблице
Требуется:
1) Проверить наличие аномальных наблюдений.
2) Построить линейную модель EMBED Equation.3 , параметры которой оценить МНК
( EMBED Equation.3 EMBED Equation.3 - расчетные, смоделированные значения временного ряда).
3) Оценить адекватность построенных моделей, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S – критерия взять табулированные 2,7 – 3,7).
4) Оценить точность моделей на основе использования средней относительной ошибки аппроксимации.
5) Осуществить прогноз спроса на следующие две недели (доверительный интервал прогноза рассчитать при доверительной вероятности р = 70%).
6) Фактические значения показателя, результаты моделирования и прогнозирования представить графически.
Решение:
1) Проверим наличие аномальных наблюдений
EMBED Equation.3
EMBED Equation.3
Результаты расчетов приведены в таблице 2.1.
Таблица 2.1
Сравним расчетное значение EMBED Equation.3 с табличным значением ( EMBED Equation.3 табл.= 1,5).
Все расчетные значения EMBED Equation.3 меньше EMBED Equation.3 табл., следовательно, аномальных значений во временном ряду нет.
2) Построим линейную модель EMBED Equation.3
Рассчитаем коэффициенты линейной модели с помощью инструмента Регрессия программы Excel. В качестве входного интервала Y берем значения спроса на кредитные ресурсы финансовой компании, в качестве входного интервала Х – номера наблюдений.
Результаты приведены в таблицах:
Таблица 2.2а
Таблица 2.2б
Таблица 2.2в
Таблица 2.2г
Уравнение линейной модели будет иметь вид:
EMBED Equation.3
3) Оценим адекватность построенных моделей, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения.
Модель является адекватной, если математическое ожидание значений остаточного ряда близко или равно нулю, и если значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения.
а) При проверке независимости ( отсутствие автокорреляции) определяется отсутствие в ряду остатков систематической составляющей
(с помощью d – критерия Дарбина-Уотсона).
Таблица 2.3
Таблица для вычисления d-критерия
(Значения остатков взяты из таблицы 2.2г).
EMBED Equation.3
Зададим уровень значимости равной 0,05. По таблицам значений критерия Дарбина-Уотсона для числа n = 9 и числа независимых переменных модели
k = 1 критическое значение d1 = 0,82 и d2 = 1,32
Так как d попало в интервал от 2 до 4, то вычисляем EMBED Equation.3 :
EMBED Equation.3 = 4 – 2,29 = 1,71
EMBED Equation.3 попало в интервал: d2 = 1,3 < d = 1,71 < 2 , по данному критерию модель адекватна.
б) Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек.
В случайном ряду чисел должно выполняться строгое неравенство:
p > EMBED Equation.3
p > EMBED Equation.3 = EMBED Equation.3
Количество поворотных точек равно 5 (рисунок 2.1). Первая часть неравенства равна 2,45. Неравенство выполняется: 5 > 2, следовательно, свойство случайности выполняется. Модель по этому критерию адекватна.
Рисунок 2.1
в) Соответствие ряда остатков нормальному закону распределения определим при помощи RS-критерия.
RS = [ Emax - Emin] / SE
Emax – максимальный уровень ряда остатков = 2,21
Emin – минимальный уровень ряда остатков = -2,99
SE - среднее квадратичное отклонение
EMBED Equation.3
RS = [2,21– (-2,99)] / 1,761 = 2,953
Расчетное значение попадает в интервал (2,7 – 3,7), следовательно, свойство нормальности распределения выполняется. Модель по этому критерию адекватна.
4) Оценим точность модели на основе использования средней относительной ошибки аппроксимации.
Среднюю относительную ошибку аппроксимации рассчитаем по формуле:
EMBED Equation.3
Построим расчетную таблицу:
Таблица 2.4
EMBED Equation.3
Данную модель можно считать приемлемой, так как рассчитанное значение средней относительной ошибки аппроксимации меньше 15%.
3,5% - хороший уровень точности модели.
5) Осуществим прогноз спроса на следующие две недели.
Рассчитаем прогнозные значения для 10 и 11 недели, подставив соответствующие значения в ранее полученное уравнение регрессии:
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
Доверительные интервалы для прогнозных значений рассчитываем по формуле:
EMBED Equation.3 , где EMBED Equation.3
Среднее значение параметра t равно:
EMBED Equation.3
Рассчитаем знаменатель дроби, находящейся под корнем, для этого построим расчетную таблицу:
Таблица 2.5
EMBED Equation.3
EMBED Equation.3 Из таблицы 2.2а берем значение стандартной ошибки оценки:
EMBED Equation.3 EMBED Equation.3
Рассчитаем Sпр для каждой недели:
EMBED Equation.3
EMBED Equation.3
Рассчитаем t-критерий Стьюдента с помощью формулы СТЬЮДРАСПОБР, при доверительной вероятности равной 70%, ? =0,3, число степеней свободы n =2:
t = 1,386
Рассчитаем доверительные интервалы:
Для 10-й недели:
EMBED Equation.3
54,2+1,386*2,32 =57,41
54,2-1,386*2,32 = 50,98
Для 11-й недели:
56,8+1,386*2,46 = 60,21
56,8-1,386*2,46 = 53,39
6) Представим графически фактические значения показателя, результаты моделирования и прогнозирования.
Список литературы:
1. Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: Учеб. Пособие. – М.: Вузовский учебник, 2007.
2. Орлова И.В. Экономико-математические методы и модели. Выполнение расчетов в среде EXCEL: Практикум: Учеб. Пособие для вузов. – М.: Финстатинформ, 2000.
3. Эконометрика: Учебник / Под редакцией И,И, Елисеевой. – М.: Финансы и статистика, 2002.
4. Практикум по эконометрике: Учебное пособие / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2001.
5. Экономико-математические методы и прикладные модели: Учеб. Пособие для вузов / В.В. Федосеев, А.Н. Гармаш, Д.М. Дайитбегов, И.В. Орлова, В.А. Половников. – М.: ЮНИТИ, 1999.
6. Гусаров В.М. Статистика: Учеб. Пособие для вузов. – М.: ЮНИТИ-ДАНА, 2001.
7. Эконометрика. Методические указания. – М.: Вузовский учебник, 2005.
8. Эконометрика. Методические указания. – М.: ИНФРА-М; Вузовский учебник, 2007.