Калуга
Задача 1
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (y, млн. руб.) от объема капиталовложений (x, млн. руб.).
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков EMBED Equation.3 ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (? = 0,05).
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (? = 0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя «y» при уровне значимости ? = 0,1, если прогнозное значение фактора «x» составит 80% от его максимального значения.
Представить графически: фактические и модельные значения Y, точки прогноза.
Составить уравнения нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение:
1. Модель линейной регрессии имеет вид: EMBED Equation.3 . Параметры «а» и «в» могут быть оценены с помощью МНК. Для автоматизации расчетов используем программу «Регрессия» статистического пакета «Анализ данных» EXCEL (Приложение 1).
Параметр «а»=12,708; параметр «в»=0,722. Получили модель: EMBED Equation.3 . Это однофакторная модель.
Параметр, который находится при факторном признаке, называется коэффициентом регрессии.
Коэффициент регрессии в=0,722 означает, что с увеличением объема капиталовложений «х» на 1 млн. руб. объем выпуска продукции «y» в среднем увеличится на 722 тыс. руб.
2. Оценку значимости, существенности параметров построенного уравнения регрессии можно с помощью t-критерия Стьюдента (? = 0,05).
Расчетные значения t-статистики для соответствующих параметров определяются по формулам: EMBED Equation.3 , где EMBED Equation.3 и EMBED Equation.3 -стандартные ошибки оценки параметров «а» и «в» (Приложение 1).
Табличное значение t-статистики можно определить с помощью стандартной функции «Мастера функций» EXCEL «СТЬЮДРАСПОБР (?,n-2)»: EMBED Equation.3 (Приложение 1).
Поскольку EMBED Equation.3 , то параметр «а» статистически значим, и поскольку EMBED Equation.3 , то коэффициент регрессии «в» - статистически значим.
3. Коэффициент детерминации EMBED Equation.3 можно рассчитать, например по формуле: EMBED Equation.3 (Приложение 1).
Таким образом, все изменения (вариации) в объеме выпуска продукции «y» на 79,5% обусловлены вариациями в объеме капиталовложений «x», т.е. в факторе, учтенном в модели. Соответственно, все изменения в объеме выпуска продукции «y» на 20,5% (100% - 79,5%) обусловлены изменениями в факторах, не учтенных в модели.
Оценку значимости уравнения регрессии в целом можно осуществить с помощью F-критерия Фишера (? = 0,05).
Расчетное значение F-критерия Фишера определяется по формуле: EMBED Equation.3 , где EMBED Equation.3 - число факторных признаков в модели (Приложение 1).
Табличное значение F-статистики можно определить с помощью стандартной функции «Мастера функций» EXCEL «FРАСПОБР (?, m, n-m-1)»: EMBED Equation.3 (Приложение 1).
Поскольку EMBED Equation.3 , то построенное уравнение регрессии статистически значимо.
Среднюю относительную ошибку аппроксимации ( EMBED Equation.3 ) можно определить по формуле: EMBED Equation.3 (Приложение 2).
Таким образом, модельные значения ( EMBED Equation.3 ) отклоняются от фактических значений ( EMBED Equation.3 ) в среднем на 9,31%. Так как величина ошибки менее 15% ( EMBED Equation.3 ), то получена модель удовлетворительной точности.
4. Остатки определяются по формуле: EMBED Equation.3 (Приложение 2).
Остаточная сумма квадратов можно определить с помощью стандартной функции «Мастера функций» EXCEL «СУММКВ»: EMBED Equation.3 (Приложение 2).
Дисперсию остатков можно определить с помощью стандартной функции «Мастера функций» EXCEL «ДИСП»: EMBED Equation.3 EMBED Equation.3 (Приложение 2).
График остатков построен с помощью «Мастера диаграмм» EXCEL и представлен в Приложении 2.
5. Для оценки адекватности модели исследуются остатки EMBED Equation.3 .
Исследование остатков ( EMBED Equation.3 ) предполагает проверку наличия у них следующих 5-ти свойств (предпосылок МНК):
а) нулевая или близкая к ней средняя величина остатков. Среднюю величину остатков можно определить с помощью стандартной функции «Мастера функций» EXCEL «СРЗНАЧ». В нашем случае средняя величина остатков нулевая: EMBED Equation.3 , т.е. первое свойство остатков выполняется (Приложение 2).
б) случайный характер остатков. Проверку случайности остатков проведем на основе критерия поворотных точек. Анализируя график остатков, делаем вывод, что число поворотных точек в ряду остатков равно 6 (р=6).
В случайном ряду чисел должно выполняться строгое неравенство: EMBED Equation.3 .
В нашем случае правая часть неравенства равна: EMBED Equation.3 .
Т.е. в нашей задаче провиденное выше неравенство EMBED Equation.3 выполняется, а значит, свойство случайности остатков имеет место.
в) независимость остатков (отсутствие автокорреляции). При проверке независимости остатков используется коэффициент автокорреляции EMBED Equation.3 . Коэффициент автокорреляции рассчитаем с помощью стандартной функции «Мастера функций» EXCEL «КОРРЕЛ»: EMBED Equation.3 (Приложение 2).
Оценим значимость полученного коэффициента автокорреляции по t-критерию. Расчетное значение t-критерия определяем по формуле: EMBED Equation.3 (Приложение 2).
Табличное значение t-статистики можно определить с помощью стандартной функции «Мастера функций» EXCEL «СТЬЮДРАСПОБР (?,n-2)»: EMBED Equation.3 (Приложение 2).
Поскольку EMBED Equation.3 , то коэффициент автокорреляции не значим.
Таким образом, автокорреляция в ряду остатков не обнаружена. Следовательно, свойство независимости остатков выполняется.
г) соответствие ряда остатков нормальному закону распределения. Соответствие ряда остатков нормальному закону распределения оцениваем при помощи R/S-критерия.
Расчетное значение R/S-критерия можно определить по формуле: EMBED Equation.3 , где EMBED Equation.3 - стандартное отклонение в ряду остатков (Приложение 2).
Полученное значение этого критерия попадает между табулированными границами (2,67; 3,57), с заданным уровнем значимости ? = 0,05 и n = 10.
Таким образом, свойство соответствия ряда остатков нормальному закону распределения выполняется.
д) гомоскедастичность дисперсии остатков. Чтобы оценить нарушения гомоскедастичности (постоянства) может использоваться тест Гольдфельда – Квандта. Выполним следующие шаги:
Упорядочение «n» - наблюдений по мере возрастания переменной «х» (Приложение 3).
Разделение совокупностей на 2 группы, соответственно с малыми и большими значениями фактора «х»; определение по каждой из групп уравнений регрессии (Приложение 3).
Определение остаточной суммы квадратов для первой и второй регрессии. Остаточную сумму квадратов для первой и второй регрессии можно определить по формулам: EMBED Equation.3 или с помощью стандартной функции «Мастера функций» EXCEL «СУММКВ»: EMBED Equation.3 (Приложение 4, Приложение 5).
Вычисление отношений EMBED Equation.3 или EMBED Equation.3 , в числителе должна быть большая сумма квадратов. В нашем случае EMBED Equation.3 (Приложение 3).
Далее используется F-критерий Фишера. Табличное значение F-статистики можно определить с помощью стандартной функции «Мастера функций» EXCEL «FРАСПОБР (?,n1-m,n-n1-m)»: EMBED Equation.3 (Приложение 3).
Поскольку EMBED Equation.3 , то гетероскедастичность остатков не обнаружена, а значит, свойство гомоскедастичности остатков выполняется.
Таким образом, построенная модель регрессии адекватна, в общем.
6. Оценим прогнозное значение факторного признака. Для получения точечного прогноза подставим в построенное уравнение регрессии ожидаемое значение EMBED Equation.3 , получим EMBED Equation.3 .
Для построения интервального прогноза определим доверительный интервал EMBED Equation.3 , где EMBED Equation.3 - отклонение от линии регрессии, рассчитываемое по формуле: EMBED Equation.3 (Приложение 6).
Определим нижнюю и верхнюю границы интервального прогноза: EMBED Equation.3 .
7. График фактических и модельных значений «y» и точек прогноза построен с помощью «Мастера диаграмм» EXCEL и представлен в Приложении 7.
8. Составим уравнения нелинейной регрессии.
Гиперболическая регрессия:
Модель гиперболической регрессии имеет вид: EMBED Equation.3 . Произведем линеаризацию модели путем замены переменной: EMBED Equation.3 . В результате получили линейное уравнение: EMBED Equation.3 . Параметры «а» и «в» могут быть оценены с помощью программы «Регрессия» статистического пакета «Анализ данных» EXCEL (Приложение 8).
Параметр «а»=60,248; параметр «в»=-704,477. Получили модель гиперболической регрессии вида: EMBED Equation.3 .
График гиперболической регрессии построен с помощью «Мастера диаграмм» EXCEL и представлен в Приложении 8.
Степенная регрессия:
Модель степенной регрессии имеет вид: EMBED Equation.3 . Произведем линеаризацию модели путем логарифмирования обеих частей уравнения: EMBED Equation.3 . Произведем замены переменных: EMBED Equation.3 . В результате получили линейное уравнение: EMBED Equation.3 . Параметры «А» и «в» могут быть оценены с помощью программы «Регрессия» статистического пакета «Анализ данных» EXCEL (Приложение 9).
Параметр «А»=0,587; параметр «в»=0,644. Уравнение регрессии будет иметь вид: EMBED Equation.3 . Выполнив потенцирование данного уравнения EMBED Equation.3 , получили модель степенной регрессии вида: EMBED Equation.3 .
График степенной регрессии построен с помощью «Мастера диаграмм» EXCEL и представлен в Приложении 10.
Показательная регрессия:
Модель показательной регрессии имеет вид: EMBED Equation.3 . Произведем линеаризацию модели путем логарифмирования обеих частей уравнения: EMBED Equation.3 . Произведем замены переменных: EMBED Equation.3 . В результате получили линейное уравнение: EMBED Equation.3 . Параметры «А» и «В» могут быть оценены с помощью программы «Регрессия» статистического пакета «Анализ данных» EXCEL (Приложение 11).
Параметр «А»=1,268; параметр «В»=0,009. Уравнение регрессии будет иметь вид: EMBED Equation.3 . Выполнив потенцирование данного уравнения EMBED Equation.3 , получили модель показательной регрессии вида: EMBED Equation.3 .
График показательной регрессии построен с помощью «Мастера диаграмм» EXCEL и представлен в Приложении 12.
9. Коэффициент детерминации для нелинейных связей называют индексом детерминации. Индекс детерминации можно рассчитать по формуле: EMBED Equation.3 .
Среднюю относительную ошибку аппроксимации ( EMBED Equation.3 ) можно рассчитать по формуле: EMBED Equation.3 .
Для гиперболической связи:
индекс детерминации равен 0,709; средняя ошибка аппроксимации равна 10,97% (Приложение 13).
Для степенной связи:
индекс детерминации равен 0,771; средняя ошибка аппроксимации равна 9,40% (Приложение 14).
Для показательной связи:
индекс детерминации равен 0,844; средняя ошибка аппроксимации равна 9,13% (Приложение 15).
Для сравнения моделей нелинейной регрессии по характеристикам индекс детерминации и средняя ошибка аппроксимации построим сводную таблицу результатов:
Все модели имеют примерно одинаковые характеристики, но большее значение индекса детерминации имеет модель показательной регрессии EMBED Equation.3 =0,844. Наименьшее значение средней относительной ошибки аппроксимации имеет модель показательной регрессии EMBED Equation.3 =9,13%, поэтому эту модель можно считать моделью наиболее удовлетворительной точности ( EMBED Equation.3 < 15%; 9,13%<9,40%<10,97%). Таким образом, модель показательной регрессии можно взять в качестве лучшей для построения прогноза.
Задача 2а
Дана структурная форма модели (СФМ), которая задана в виде матрицы коэффициентов модели. Необходимо записать систему одновременных уравнений и проверить систему на идентифицируемость.
Исходные данные:
Решение:
Система одновременных уравнений имеет вид:
EMBED Equation.3 ;
EMBED Equation.3 ;
EMBED Equation.3 .
Запишем систему одновременных уравнений, используя исходные данные:
EMBED Equation.3 ; EMBED Equation.3 EMBED Equation.3 ;
EMBED Equation.3 ; EMBED Equation.3 EMBED Equation.3 ;
EMBED Equation.3 . EMBED Equation.3 EMBED Equation.3 .
Проверим систему на идентифицируемость.
Для того чтобы система одновременных уравнений была идентифицируема, необходимо, чтобы каждое уравнение системы было идентифицируемо, т.е. выполнялись необходимое и достаточное условия идентификации.
Необходимое условие идентификации можно записать в виде следующего счетного правила:
• если D+1<Н, то уравнение неидентифицируемо;
• если D+1=Н, то уравнение идентифицируемо;
• если D+1>Н, то уравнение сверхидентифицируемо,
где Н – число эндогенных переменных в уравнении; D – число предопределенных переменных, которые содержатся в системе уравнений, но не входят в данное уравнение.
Достаточное условие идентификации для данного уравнения выполнено, если определитель полученной матрицы не равен нулю, а ранг матрицы не меньше, чем количество эндогенных переменных в системе без одного.
а) Проверим первое уравнение системы EMBED Equation.3 на выполнение необходимого и достаточного условия идентификации.
В этом уравнении две эндогенные переменные EMBED Equation.3 и EMBED Equation.3 (Н=2). В нем отсутствуют эндогенная переменная EMBED Equation.3 и экзогенная переменная EMBED Equation.3 (D=2). Уравнение сверхидентифицируемо, т.к. D+1>Н;(3>2), а значит необходимое условие идентификации выполнено.
Для проверки на достаточное условие составим матрицу из коэффициентов при переменных EMBED Equation.3 и EMBED Equation.3 , взятых в других уравнениях.
Определитель полученной матрицы не равен нулю, т.к. EMBED Equation.3 , а ранг матрицы равен 2. Значит, достаточное условие выполнено, и первое уравнение идентифицируемо.
б) Проверим второе уравнение системы EMBED Equation.3 на выполнение необходимого и достаточного условия идентификации.
В этом уравнении три эндогенные переменные EMBED Equation.3 , EMBED Equation.3 и EMBED Equation.3 (Н=3). В нем отсутствуют две экзогенные переменные EMBED Equation.3 и EMBED Equation.3 (D=2). Уравнение идентифицируемо, т.к. D+1=Н;(3=3), а значит необходимое условие идентификации выполнено.
Для проверки на достаточное условие составим матрицу из коэффициентов при переменных EMBED Equation.3 и EMBED Equation.3 , взятых в других уравнениях.
Определитель полученной матрицы не равен нулю, т.к. EMBED Equation.3 , а ранг матрицы равен 2. Значит, достаточное условие выполнено, и второе уравнение идентифицируемо.
в) Проверим третье уравнение системы EMBED Equation.3 на выполнение необходимого и достаточного условия идентификации.
В этом уравнении две эндогенные переменные EMBED Equation.3 и EMBED Equation.3 (Н=2). В нем отсутствуют эндогенная переменная EMBED Equation.3 и экзогенная переменная EMBED Equation.3 (D=2). Уравнение сверхидентифицируемо, т.к. D+1>Н;(3>2), а значит необходимое условие идентификации выполнено.
Для проверки на достаточное условие составим матрицу из коэффициентов при переменных EMBED Equation.3 и EMBED Equation.3 , взятых в других уравнениях.
Определитель полученной матрицы не равен нулю, т.к. EMBED Equation.3 . Значит, достаточное условие выполнено, и третье уравнение идентифицируемо.
Система одновременных уравнений считается неидентифицируемой, если хотя бы одно уравнение системы неидентифицируемо. Следовательно, рассматриваемая в целом система идентифицируема.
Задача 2в
По данным таблицы, используя косвенный метод наименьших квадратов, построить структурную форму модели вида:
EMBED Equation.3
EMBED Equation.3
Исходные данные:
Решение:
Для решения данной задачи воспользуемся следующей идентифицируемой моделью, содержащей две эндогенные EMBED Equation.3 и две экзогенные EMBED Equation.3 переменные:
EMBED Equation.3
EMBED Equation.3
Структурную форму модели преобразуем в приведенную форму модели:
EMBED Equation.3
EMBED Equation.3
где EMBED Equation.3 и EMBED Equation.3 - случайные ошибки.
Для каждого уравнения приведенной формы при расчете коэффициентов EMBED Equation.3 применим КМНК.
Для упрощения расчетов будем работать с отклонениями от средних уровней EMBED Equation.3 и EMBED Equation.3 . Преобразованные таким образом данные представлены в таблице (Приложение 16).
В этой же таблице представлены промежуточные расчеты, необходимые для определения коэффициентов EMBED Equation.3 .
Для нахождения коэффициентов EMBED Equation.3 первого приведенного уравнения используем следующую систему нормальных уравнений:
EMBED Equation.3
EMBED Equation.3
Подставляя необходимые данные из таблицы, получим:
EMBED Equation.3
EMBED Equation.3
Решение этих уравнений дает значения EMBED Equation.3 и EMBED Equation.3 .
Первое уравнение приведенной формы модели примет вид:
EMBED Equation.3 .
Для нахождения коэффициентов EMBED Equation.3 второго приведенного уравнения используем следующую систему нормальных уравнений:
EMBED Equation.3
EMBED Equation.3
Подставляя необходимые данные из таблицы, получим:
EMBED Equation.3
EMBED Equation.3
Решение этих уравнений дает значения EMBED Equation.3 и EMBED Equation.3 .
Второе уравнение приведенной формы модели примет вид:
EMBED Equation.3 .
Для перехода от приведенной формы к структурной форме модели найдем EMBED Equation.3 из второго уравнения приведенной формы модели:
EMBED Equation.3 .
Подставим это выражение в первое уравнение приведенной модели, найдем структурное уравнение:
EMBED Equation.3 .
Таким образом, EMBED Equation.3 .
Найдем EMBED Equation.3 из первого уравнения приведенной формы модели:
EMBED Equation.3 .
Подставим это выражение во второе уравнение приведенной модели, найдем структурное уравнение:
EMBED Equation.3 .
Таким образом, EMBED Equation.3 .
Свободные члены структурной формы находим из уравнений:
EMBED Equation.3 ;
EMBED Equation.3 .
Окончательный вид структурной модели:
EMBED Equation.3 ;
EMBED Equation.3 .