Вариант 2
Задача состоит в построении модели для предсказания цены квартиры в строящихся домах в Санкт-Петербурге в 1996 г.
Цена квартиры – это зависимая переменная Y (тыс. долл.). В качестве независимых, объясняющих переменных выбраны число комнат в квартире Х1 , общая площадь квартиры Х3 (м2) , жилая площадь квартиры Х4 (м2) , площадь кухни Х5 (м2).
Требуется:
Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.
Рассчитать параметры модели.
Для оценки качества всего уравнения регрессии определить:
линейный коэффициент множественной корреляции;
коэффициент детерминации.
Осуществить оценку значимости уравнения регрессии.
Оценить с помощью t- критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
Оценить влияние факторов на зависимую переменную по модели.
Построить точечный и интервальный прогноз результирующего показателя на два шага вперёд ? = 0,1.

Построение системы показателей (факторов).
Анализ матрицы коэффициентов парной корреляции.
Выбор факторных признаков для построения
Двухфакторной регрессионной модели
Статистические данные по всем переменным приведены в табл. 1. В этом примере n = 25, m = 4.






Таблица 1.
Использование инструмента Корреляция
(Анализ данных в EXCEL)
Для проведения корреляционного анализа выполним следующие действия:
Данные для корреляционного анализа выполним следующие действия:
Выберем команду Сервис>Анализ данных.
В диалоговом окне Анализ данных выберем инструмент Корреляция, а затем щелкните на кнопке ОК.
В диалоговом окне Корреляция в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные. Так как выделены и заголовки столбцов, то установим флажок Метки в первой строке.
Выберем параметры вывода. В данном примере Новый рабочий лист.
ОК.
Результат корреляционного анализа
Таблица 2.
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. цена квартиры, имеет тесную связь с числом комнат (ryx1 = 0,801), с общей площадью квартиры (ryx3 = 0,912), с жилой площадью квартиры (ryx4 = 0,850) и с площадью кухни (ryx5 = 0,793). Однако факторы Х3 и Х4 тесно связаны между собой (rx3 x4 = 0,975), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х3 – общая площадь квартиры. В этом примере n = 25, m = 4, после исключения незначимых факторов n = 25, k = 2.

Выбор вида модели и оценка ее параметров




Таблица 3.
Применение инструмента Регрессия
(Анализ данных в EXCEL)
Для проведения регрессионного анализа выполним следующие действия:
Выберем команду Сервис>Анализ данных.
В диалоговом окне Анализ данных выберем инструмент Регрессия, а затем щелкнем на кнопку ОК.
В диалоговом окне Регрессия в поле Входной интервал Y введем адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х введем адреса одного или нескольких диапазонов, которые содержат значения независимых переменных (рис. 1.1).
Так как выделены и заголовки столбцов, то установим флажок Метки в первой строке.
Выберем параметры ввода. В данном примере Новая рабочая книга.
В поле Остатки поставим необходимые флажки.
ОК.

Рис. 1. 1. Диалоговое окно Регрессия подготовлено к выполнению анализа данных
Результат регрессионного анализа содержится в табл. 4 – 7.
Рассмотрим содержание этих таблиц.
Таблица 4.
Таблица 5.
Таблица 6.
Таблица 7.
Вывод остатка

График остатков изображен на рис. 1.2.

Рис. 1.2. График остатков
Оценка качества всего уравнения регрессии
В таблице 7 приведены вычисленные (предсказанные) по модели зависимой переменной Y и значения остаточной компоненты ?i .
Значение коэффициентов детерминации и множественной корреляции можно найти в таблице Регрессионная статистика.
Коэффициент детерминации:

R2 = R2yx1x2 = 1 - EMBED Equation.3
Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 83,4% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Коэффициент множественной корреляции R:
R = EMBED Equation.3
Он показывает тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами. Следовательно связь весьма тесная.
4. Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:
F= EMBED Equation.3
Проверку значимости уравнения регрессии произведем на основе F-критерия Фишера
Значение F-критерия Фишера можно найти в табл. 5 протокола EXСEL.
Табличное значение F-критерия можно найти с помощью функции FРАСПОБР (рис. 1.3).

Рис. 1.3. Определение табличного значения F-критерия
Табличное значение F-критерия при доверительной вероятности 0,95 при ?1 = k = 2 и ?2 = n – k = 25 – 2 – 1 = 22 составляет 3,44.
Поскольку Fрас > Fтабл, уравнение регрессии следует признать адекватным.
Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии
Значимость коэффициентов уравнения регрессии а0, а1, а2 оценим с использованием t-критерия Стьюдента.
Расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии а1, а2 приведены в четвертом столбце табл. 6 протокола EXCEL. Табличное значение t-критерия Стьюдента можно найти с помощью функции СТЬЮДРАСПОБР (рис. 1.4).

Рис. 1.4. Определение табличного значения t-критерия Стьюдента
Табличное значение t-критерия при 5%-ном уровне значимости и степенях свободы (25 – 2 – 1) составляет 2,07. Так как для а1 EMBED Equation.3 < EMBED Equation.3 , а для а2 EMBED Equation.3 > EMBED Equation.3 , то следовательно коэффициент а1 статистически незначим, а коэффициент а2 статистически значим.
6. Проанализировать влияние факторов на зависимую переменную по модели (для каждого коэффициента регрессии вычислить коэффициент эластичности, ?-коэффициент)
Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем коэффициент эластичности (Э) и бета-коэффициент, которые соответственно рассчитываются по формулам:
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3

EMBED Equation.3
EMBED Equation.3
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.
Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных. Это означает, что при уменьшении числа комнат на единицу цена квартиры уменьшится на 1 тыс. долл. (- 0,097 ·10,911).
7. Определить точечные прогнозные оценки цены квартиры на два квартала вперед (t0,7 =1,12)
Исходные данные представлены временными рядами, поэтому прогнозные значения Х1,26, Х2,26 и Х1,27, Х2,27 можно определить с помощью экспертных оценок, с помощью средних абсолютных приростов или вычислить на основе экстраполяционных методов.
Для фактора Х1 Число комнат в квартире выбрана модель
EMBED Equation.3 , по которой получен прогноз на 2 месяца вперед. График модели временного ряда Число комнат в квартире приведен на рис. 1.5.


Рис 1.5. Прогноз показателя Число комнат в квартире
Для временного ряда Общая площадь квартиры в качестве аппроксимирующей функции в аппроксимирующей функции выбран полином третьей степени (парабола), по которой построен прогноз на 2 шага вперед. На рис. 1.6 приведен результат построения тренда для временного ряда Общая площадь квартиры.
EMBED Equation.3 .


Рис. 1.6. Прогноз показателя Общая площадь квартиры
Для получения прогнозных оценок зависимостей переменной по модели
EMBED Equation.3
подставим в нее найденные прогнозные значения факторов Х1 и Х2:
EMBED Equation.3