Всероссийский заочный Финансово-Экономический институт
Кафедра математики и информатики
Отчет по аудиторной работе
Вариант 26
По дисциплине «эконометрика»
г. Барнаул 2006
Задание 26
В табл. представлены данные о рынке строящегося жилья в Санкт-Петербурге.
Принятые в таблице обозначения:
У – цена квартиры, тыс. долл.;
Х1 – число комнат в квартире;
Х2 – район города ( 1 – Приморский, Шувалово – Озерки, 2 – Гражданка, 3 – Юго-запад, 4 – Красносельский);
Х3 – общая площадь квартиры (м2);
Х4 – жилая площадь квартиры (м2)
Х5 – площадь кухни (м2);
Х6 – тип дома ( 1 – кирпичный, 0 – другой);
Х7 – наличие балкона ( 1 – есть, 0 – нет);
Х8 – число месяцев до окончания срока строительства.
Задание
1. введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы : квартиры на севере города ( приморский район, Шувалово – Озерки, Гражданка) и на юге города ( Юго-запад, Красносельский район).
2. Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z.
3. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме. Установите, какие факторы мультиколлинеарны.
4. Постройте модель у= f (х3,х6, х7, х8, z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?
5. Существует ли разница в ценах квартир, расположенных в северной и южной частях Санкт-Петербурга?
6. Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения проверьте с помощью F-критерия; оцените качество уравнения регрессии с помощью коэффициента детерминации R2.
Решение:
Построение системы показателей (факторов). Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели
Таблица
Статистические данные по всем переменным приведены в таблице. Количество наблюдений n=20, а число факторных переменных m=7.
Для проведения корреляционного анализа выполняем:
Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.
Выберите команду Сервис >Анализ данных.
В диалоговом окне Анализ данных выберите инструмент Корреляция, затем щелкните на кнопке ОК.
В диалоговом окне Корреляция в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные.
Выберите параметры ввода.
ОК
Результат корреляционного анализа:
Таблица 1.1
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная цена квартиры, имеет тесную связь с числом комнат в квартире (rух1= 0,7714), с общей площадью квартиры ( rух3=0,8979), с жилой площадью квартиры (rух4=0,8248) и с площадью кухни (rух5=0,8370).
Проверим выполнение условий для каждой пары факторных переменных:
Коэффициент корреляции между двумя факторными переменными должен быть меньше 0,8 и одновременно меньше коэффициентов корреляции между исследуемой переменной и каждой из этих факторов.
Если хотя бы одно из условий неравенств не выполняется, то в модель включают только один из этих двух факторов, а именно тот, у которого модуль коэффициента корреляции с у больше.
¦rxіxј¦<0,8
¦rxіxј¦<¦ryxі¦
¦rxіxј¦<¦ryxј¦
Х1Х3
0,8841 <0,8 (не выполняется)
0,8841 <0,7714 (не выполняется)
0,8841 <0,8979 (выполняется)
Х1Х4
0,9224 <0,8 (не выполняется)
0,9224 <0,7714 (не выполняется)
0,9224 <0,8248 (не выполняется)
Х3Х4
0,9706 <0,8 (не выполняется)
0,9706 <0,8979 (не выполняется)
0,9706 <0,8248 (не выполняется)
Факторы Х1 и Х3 мультиколлинеарны, их не рекомендуется использовать в модели одновременно, т.к. коэффициент парной корреляции больше 0,8, rx1x3 =0,8841.
Факторы Х1 и Х4 мультиколлинеарны, их не рекомендуется использовать в модели одновременно, т.к. коэффициент парной корреляции больше 0,8, rх1х4=0,9224.
Факторы Х3 и Х4 мультиколлинеарны, их не рекомендуется использовать в модели одновременно, т.к. rх3х4=0,9706>0,8.
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, цена квартиры, имеет тесную связь с числом комнат в квартире (rух1=0,7714), с общей площадью квартиры (ryx3=0,8979), с жилой площадью квартиры (ryx4=0,8248) и с площадью кухни (ryx5=0,8370).Факторы Х3 и Х4 тесно связаны между собой (rx3x4=0,9706), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х3,т.к.эта переменная теснее связана с зависимой переменной У.
Для проведения регрессионного анализа выполняем:
1.Выберите команду Сервис >Анализ данных.
2.В диалоговом окне Анализ данных выберите инструмент Регрессия, затем щелкните на кнопке ОК.
3. В диалоговом окне Регрессия в поле Входной интервал У введите адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х введите адреса одного или нескольких диапазонов, которые содержат значения независимых переменных.
4. если выделены и заголовки столбцов, то установить флажок Метки в первой строке.
5. выберите параметры вывода.
6. в поле Остатки поставьте необходимые флажки.
7. ОК
Таблица 1.2
Таблица 1.3
Таблица 1.4
Таблица 1.5
Y=-1,939+2,050*Х1+0,345*Х3-0,034*Х4+0,073*Х5+8,863*Х6+1,546*Х7-0,066*Х8
Таблица 1.6
Относительная ошибка апроксимации Еотн =4,1791. 4,1791<15%, следовательно модель имеет высокую точность.
2. Оценка качества всего уравнения регрессии
В табл.1.5 приведены вычисления по модели значения зависимой переменной У и значения остаточной компоненты EMBED Equation.3 .
Значение коэффициентов детерминации и множественной корреляции можно найти в таблице1.2.
Оценим качество уравнения регрессии с помощью коэффициента детерминации R2=0,985, следовательно, около 98% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Коэффициент множественной корреляции R: R= EMBED Equation.3 =0,992.
Он показывает тесноту связи зависимой переменной У с двумя включенными в модель объясняющими факторами.
3. Проверка значимости уравнения регрессии. с помощью F- критерия Фишера.
Табличное значение F- критерия при доверительной вероятности 0,05 при v1= к=7 и v2=20-7-1=12 составляет 2,913. Табличное значение F- критерия можно найти с помощью функции FРАСПОБР
Поскольку Fрасч>Fтабл (110,797>2,913), уравнение регрессии следует признать адекватным.
4. Оценить с помощью критерия t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии
Оценим статистическую значимость параметров регрессионной модели у=f(x1;х3;х4;х5;х6;х7;х8) с помощью t-критерия Стьюдента.
Табличное значение t –критерия Стьюдента найдем с помощью функции СТЬЮДРАСПОБР.
Табличное значение t- критерия при 5%- уровне значимости и степенях свободы (20-7-1=12) составляет 2,179. Так как tрас?tтабл, то коэффициенты а3 и а6 существенны (значимы)
5. Построим модель y=f(x3,x6,x7,x8,z).
У=-1,1657+0,4006*Х3+8,7667*Х6+1,4404*Х7-0,0796*Х8
Находим матрицу парных коэффициентов корреляции модели y=f(x3,x6,x7,x8,z) с помощью MS Excel аналогично первому примеру (Сервис>Анализ данных >Корреля- ция).
Результат корреляционного анализа:
Таблица 2.1
На формирование цены квартиры воздействуют общая площадь квартиры Х3 rху3=0,8979.
Таблица 2.2
Таблица 2.3
Таблица 2.4
У=-1,1657+0,4006*Х3+8,7667*Х6+1,4404*Х7-0,0796*Х8
Относительная ошибка апроксимации Е отн=3,763<15%, следовательно модель имеет высокую точность.