Уфа 2007
Задача
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y млн.руб.) от объема капиталовложений (X, млн. руб.).
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков S? ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t- критерия Стьюдента (?=0,05).
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (?=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя Y при уровне значимости ?=0,1, если прогнозное значение фактора X составит 80% от его максимального значения.
Представить графически: фактические и модельные значения Y, точки прогноза.
Составить уравнения нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение:
1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
2. Вычислить остатки; найти остаточную сумму квадратов; построить график остатков
Для иллюстрации возможностей данного режима работы программы «СтатЭксперт» исследуем взаимосвязь показателя Y от фактора Х (см. исходные данные).
Для работы и запуска режима «Регрессия» необходимо:
1. Загрузить среду EXCEL;
2. Загрузить программу «СтатЭксперт»: нажать кнопку «Пуск» ? В «Главном меню» строка «Программы» ? программа «СтатЭксперт». На экране получите изображение исходного состояния программы;
3. Загрузить таблицу исходных данных: нажать кнопку «Пуск» ? В «Главном меню» строка «Документы» ? файл с исходными данными. На экране получите изображение состояния программы;
4. Выделить рабочее поле таблицы (данные, которые необходимы для расчетов), т.е. выделенный блок кроме числовых данных, не будет содержать наименования переменных, иметь наименования таблицы и наблюдений;
5. Установить курсор на пункт меню «СтатЭкс», нажать левую клавишу «мышки» и в появившемся меню выбрать пункт «Регрессия».
6. В появившемся диалоговом окне «Установка блока данных» (рис. 4.7) убедиться, что все проставленные там установки соответствуют вашей таблице исходных данных, а для этого необходимо:
«Ориентация таблицы» – поставить метку «по строкам», т.к. сформирована по строкам;
«Наличие наименований» – удалить все метки напротив надписей «таблица», «наблюдения», «переменные».
После выполнения этих операций нажмите клавишу «Установить»? появится диалоговое окно «Регрессионный анализ».
7. В появившемся диалоговом окне «Регрессионный анализ» убедиться, что все проставленные там установки соответствуют вашему заданию:
В списке выбранных переменных следует указать зависимую переменную. Для этого нажмите кнопку «Выбор», в появившемся окне установите курсор на «Показатель А», а затем нажмите кнопку «Установить».
В поле «Зависимая переменная» вместо фразы «зависимая переменная не определена» появится наименование выбранной переменной. Ее наименование удаляется из списка выбранных переменных.
Для отказа от режима прогнозирования убрать в окнах флажки в секторе «Прогноза».
В блоке «Вид регрессии» выберите пункт «Линейная регрессия» и нажмите соответствующую ей кнопку «Параметры».
«Структура отчета» включает в себя весь список таблиц.
Нажать клавишу «Вычислить».
Программа запросит разрешения подключить к выбранным факторам параметр «Время». Ответьте на этот вопрос отрицательно.
Через непродолжительное время появится протокол решения, представленный ниже. Нажать левую кнопку мышки, когда ее указатель установлен на пиктограмме «Список таблиц отчета» или «Графики отчета» при просмотре отчета по регрессионному анализу. Это приведет к появлению соответствующего меню.
Для линейной регрессии первая таблица, называется «Оценки коэффициентов линейной регрессии». В данной таблице представлены значения параметров модели (коэффициентов регрессии) их статистическая оценка, а также коэффициенты, предназначенные для экономической интерпретации коэффициентов регрессии (эластичность, бета – коэффициент, дельта – коэффициент).
«Таблица остатков» содержит пять граф:
- имя переменной (в таблицах она выражается датой или порядковым номером наблюдений);
- фактическое значение зависимой переменной (Факт) Y – «выпуск продукции»;
- расчетное значение Y - выпуск продукции (Расчет);
- абсолютное отклонение расчетных значений от фактических (Ошибка абс.);
- относительное отклонение: факт минус расчет, деленное на факт и умноженное на 100% (Ошибка относит.).
Таблица «Характеристики остатков» содержит наименование показателя и его числовое значение. В последней строке приведен вывод относительно значимости построенной модели. Если модель незначима или имеет низкое значение критерия качества (его значение в этом случае окрашивается в красный цвет), использовать ее для прогнозирования нельзя.
В динамических рядах наиболее важным является правильность отображения исследуемого показателя на последнем участке наблюдения. Поэтому, в качестве дополнительной информации для оценки точности модели, целесообразно привлекать величину ошибок аппроксимации на конце периода наблюдения. Для лучшего восприятия результатов наблюдений, которые отличаются от расчетных значений более чем на 10%,величина относительной ошибки в таблице выделяется красным цветом. Для абсолютного и относительного отклонений остаточной компоненты строятся графики.
Из таблицы “Характеристики модели” выделим параметры модели в столбце “Коэффициенты”. Тогда, модель линейной регрессии имеет вид: Yл(х) = b(0) + b(1) * X
Yл(х) = 8,120 + 0,968 * X
Коэффициент регрессии "b" показывает, что с ростом объема капвложений (Х) на 1 млн.руб. выпуск продукции (У) вырастет на 0.968 млн.руб.
2. Постройте график остатков
4. Оценить статистическую значимость параметров уравнения регрессии с помощью t-критерия Стьюдента.
5. Вычислить коэффициент детерминации; проверить значимость уравнения регрессии с помощью F-критерия Фишера; вычислить среднюю относительную ошибку. Сделать вывод о качестве модели
Для оценки качества модели регрессии вычисляют коэффициент детерминации (R-квадрат):
EMBED Equation.3
Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,80% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Проверку значимости уравнения регрессии произведем на основе вычисления F – критерия Фишера:
F= EMBED Equation.3 .
Табличное значение F- критерия (Fкрит) при доверительной вероятности 0,95 при EMBED Equation.3 и EMBED Equation.3 составляет 5,32.
если Fфакт > Fкрит, то уравнение значимо с вероятностью 95%;
если Fфакт < Fкрит, то уравнение незначимо с вероятностью 95%, т.е. не пригодна к использованию.
Т.к. Fфакт > Fкрит, то уравнение значимо с вероятностью 95%.
Оценим с помощью t – критерия Стьюдента статистическую значимость коэффициентов уравнения линейной регрессии.
Расчетные значения t- критерия Стьюдента для коэффициентов уравнения регрессии приведены в третьем столбце. EMBED Equation.3
Табличное значение t- критерия при 5% уровне значимости и степени свободы k=10-1-1=8 составляет 2,31.
Если tрасч > tтабл, то коэффициент статистически значим.
tb0 = 11,413 > 2.31 => коэффициент регрессии b0 статистически значим;
tb1 = 25,809 > 2.31 => коэффициент регрессии b1 статистически значим;
Точность модели оценивается по средней относительной ошибке:
EMBED Equation.3
Т.к. Еотн = 4,967% < 5%, то модель признается точной.
Таким образом, можно сделать вывод о хорошем качестве модели.
8. Составить уравнения нелинейной регрессии: гиперболической; степенной; показательной.
Представить графически фактические и модельные значения
Степенная модель регрессии в СтатЭксперт
Для нахождения степенной модели необходимо сделать преобразование исходных данных:
Произведем логарифмирование данного уравнения: lg(y*) = lg(a) + b * lg(x)
Обозначим: Y = lg(y); X = lg(x); A = lg(a)
Тогда уравнение примет вид линейного уравнения: Y = A + b * X
Составим таблицу исходных данных, а также расчетных данных, необходимых для построения и анализа модели
Модель «линейной» регрессии имеет вид:
lg(y*) = lg(a) + b * lg(x) = 0,854 * 0,453 * lg(x)
Тогда, степенная модель имеет вид:
Yс(х) = 7,142 * X0,453
Коэффициент детерминации:
EMBED Equation.3
Следовательно, 99,8% вариации зависимой переменной учтено в модели и обусловлено влиянием включенного фактора.
Средняя относительная ошибка:
EMBED Equation.3
Т.к. Еотн = 3,758% < 5%, то модель признается точной.
Показательная модель регрессии в СтатЭксперт
Для нахождения показательной модели необходимо сделать преобразование исходных данных:
Произведем логарифмирование данного уравнения: lg(y*) = lg(a) + x * lg(b)
Обозначим: Y = lg(y); B = lg(b); A = lg(a)
Тогда уравнение примет вид линейного уравнения: Y = A + B * x
Составим таблицу исходных данных, а также расчетных данных, необходимых для построения и анализа модели
Модель линейной регрессии имеет вид:
lg(y*) = lg(a) + x * lg(b) = 0,997 * 1,049 * Х
Тогда, показательная модель имеет вид:
Yп(х) = 9,924 * 1,049Х
Коэффициент детерминации:
EMBED Equation.3
Следовательно, 99,9% вариации зависимой переменной учтено в модели и обусловлено влиянием включенного фактора.
Средняя относительная ошибка:
EMBED Equation.3
Т.к. Еотн = 3,798% < 5%, то модель признается точной.
Гиперболическая модель регрессии в СтатЭксперт
Для нахождения гиперболической модели необходимо сделать преобразование исходных данных:
Обозначим: Х = 1/х
Тогда уравнение примет вид линейного уравнения: y = a + b * X
Составим таблицу исходных данных, а также расчетных данных, необходимых для построения и анализа модели
Модель линейной регрессии имеет вид:
lg(y*) = a + b * Х = 28,003 - 23,718 * Х
Тогда, гиперболическая модель имеет вид:
Yг(х) = 28,003 - 23,718 / х
Коэффициент детерминации:
EMBED Equation.3
Следовательно, 92,3% вариации зависимой переменной учтено в модели и обусловлено влиянием включенного фактора.
Средняя относительная ошибка:
EMBED Equation.3
Т.к. Еотн = 37,049% > 15%, то модель признается неточной.
Представить графически фактические и модельные значения
Рис.3: Линейная модель
EMBED Excel.Chart.8 \s
Рис.4: Степенная, Показательная, Гиперболическая модель
9. Сравнение моделей
Все модели сравнительно одинаково описывают процесс, но лучшие показатель имеет показательная модель
Общий вывод:
Модели, полученные в СтатЭксперте, совпадают с результатами контрольной работы и лабораторной работы, сделанной в Excel.
Результаты сравнения (коэф-т детерминации и средняя ошибка аппроксимации), полученные в СтатЭксперте, не совпадают с результатами контрольной работы и лабораторной работы, сделанной в Excel. Возможной причиной является неправильные настройки СтатЭксперта.
Результаты, полученные в Excel, совпадают с результатами контрольной работы.