Задача 1
вариант 4
По предприятиям легкой промышленности региона получена информация (табл.1), характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объема капиталовложений (Х, млн. руб.).
Таблица 1
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков EMBED Equation.3 ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (? = 0,05).
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (? = 0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя Y при уровне значимости ? =0,1, если прогнозное значение фактора Х составит 80% от его максимального значения.
Представить графически: фактические и модельные значения Y, точки прогноза.
Составить уравнение нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение:
1. Уравнение линейной регрессии имеет вид: EMBED Equation.3 .
Значения параметров a и b линейной модели определим, используя данные таблицы 2.
Таблица 2
EMBED Equation.3
Уравнение линейной регрессии имеет вид: y = 13,96 + 2,4? х
Интерпретировать можно лишь знак при параметре а. В этой задаче, а>0, следовательно, относительное изменение результата происходит медленнее, чем изменение фактора. Иными словами, вариация результата меньше вариации фактора – коэффициент вариации по фактору х выше коэффициента вариации для результата у: Vx >Vy.
2. Значения остатков еi рассчитаны в таблице 3.Остаток еi – расхождение между фактическим и спрогнозированным значениями величины у. Квадратный корень из этой величины называется стандартной ошибкой оценки.
Таблица 3
EMBED Equation.3 EMBED Equation.3
Остаточная сумма квадратов отклонений EMBED Equation.3 EMBED Equation.3
Стандартная ошибка оценки Se = 5,1
EMBED Excel.Chart.8 \s
Рис.1. График остатков
3. Независимость остатков проверяется с помощью критерия Дарбина – Уотсона.
EMBED Equation.3 EMBED Equation.3
Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.
Значение статистики dw найдено по промежуточным данным в таблице 3. Оценки, полученные по критерию, являются не точными, а интервальными. Верхние (d2) и нижние (d1) критические значения для уровня значимости ?=0,05, k = 1, n=10 берем из таблицы d1=1,08 и d2=1,36. Перед сравнением с табличными значениями dw критерий следует преобразовать по формуле dw'= 4 – dw = 4- 1,703= 2,3. Таким образом, получается, что dw>2, что свидетельствует о наличии отрицательной корреляции.
Установив наличие автокорреляции остатков, переходят к улучшению модели. В частности, можно воспользоваться первым коэффициентом автокорреляции
EMBED Equation.3 EMBED Equation.3
Для принятия решения о наличии или отсутствии автокорреляции в исследуемом ряду фактическое значение коэффициента автокорреляции r(1) сопоставляется с табличным значением для 5%-ного уровня значимости. r(1)табл. =0,36> 0,013, следовательно, гипотеза об отсутствии автокорреляции может быть принята.
4. Значимость коэффициентов уравнения регрессии оценим с использованием t-критерия Стьюдента.
Значения t-критерия вычислим по формулам для соответствующих коэффициентов регрессии.
EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 EMBED Equation.3
Коэффициент Стьюдента t для m = n- 2 = 8 степеней свободы и уровня значимости ?=0,05 равен 2,3060.
Так как t – расчетное с (n – 2) степенями свободы в обоих случаях превышает t – табличное при заданном уровне значимости, то оба коэффициента регрессии считаются значимыми.
5. Рассчитаем коэффициент детерминации:
EMBED Equation.3 .
Он показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т.е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.
Чем ближе R2 к 1, тем лучше качество модели.
Таким образом, вариация результата Y (объема выпуска продукции) на 96,84% объясняется вариацией фактора X (объемом капиталовложений). Качество модели очень хорошее, линейная модель хорошо аппроксимирует исходные данные, и ею можно воспользоваться для прогноза значений результативного признака.
Для проверки значимости модели регрессии используется F-критерий Фишера:
EMBED Equation.3
F>Fтабл= 5,32 для ?=0,05, k1 =m =1, k2 = n-m-1 = n-2 =8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F>Fтабл..
Определим среднюю относительную ошибку аппроксимации:
EMBED Equation.3
В среднем значение y для степенной модели отличаются от фактических значений на 3,864%. Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Так как ошибка аппроксимации данной модели меньше 7%, то это свидетельствует о хорошем качестве модели.
6. Пусть хпрогн= 0,8*хmax = 0,8*54= 43,2, сделаем прогноз для среднего значения показателя Y при уровни значимости ?=0,1.
Стандартную ошибку предсказываемого по линии регрессии значения найдем по формуле:
EMBED Equation.3 ;
EMBED Equation.3 .
Дана формула характеризует ошибку положения линии регрессии. Величина стандартной ошибки предсказываемого среднего значения у при заданном значении хпрогн достигает минимума при хпрогн = х, и возрастает по мере того, как «удаляется» от х в любом направлении.
EMBED Equation.3 EMBED Equation.3
Для прогнозируемого значения yх 95%-ные доверительные интервалы при заданном хпрогн определяются выражением EMBED Equation.3 , т.е. EMBED Equation.3 EMBED Equation.3 или ?43,11, при значении коэффициента Стьюдента t?=25,968 для m=8 степеней свободы и уровня значимости 0,1.
Прогнозное значение составит упрогн = 13,96 +2,4 • 43,2 = 117,64, которое представляет собой точечный прогноз.
Прогноз линии регрессии в интервале составит:
117,64 - 43,11 ? EMBED Equation.3 ? 117,64+43,11 т.е.
74,53 ? EMBED Equation.3 ? 160,75.
7. Построим график фактических, модельных значений Y, точек прогноза.
Для линейной модели регрессии доверительный интервал рассчитывается следующим образом. Оценивается величина отклонения от линии регрессии (обозначим ее U):
EMBED Equation.3
Коэффициент Стьюдента t? для m=8 степеней свободы (m=n-1) и уровня значимости 0,1 равен 1,8595. Тогда:
EMBED Equation.3 EMBED Equation.3
Таким образом, прогнозное значение EMBED Equation.3 = 117,64 будет находиться между верхней границей, равной 117,64+9,974 = 127,6, и нижней границей, равной 117,64-9,974 = 107,7. График исходных данных и результаты моделирования приведены на рис. 2.
EMBED Excel.Chart.8 \s
Рис.2. График модели парной регрессии зависимости объема выпуска продукции от объема капиталовложения.
8. Составим уравнение нелинейной регрессии:
Построение гиперболической функции.
Уравнение гиперболической функции: y = a+b/x
Произведем линеаризацию модели путем замены Х = 1/х.
В результате получим линейное уравнение: y = a+b •Х
Рассчитаем его параметры по данным таблицы 4:
Таблица 4
EMBED Equation.3
Получим следующее уравнение гиперболической модели:
y= 198,76-3293,9/х.
Построение степенной функции.
Уравнение степенной модели имеет вид: y = a+xb.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: lg y = lg a +b lg x.
Таблица 5
Обозначим Y= lg y, X= lg x, А= lg а. Тогда уравнение примет вид Y= A+ bX – линейное уравнение регрессии.
Рассчитаем его параметры, используя данные табл. 6.
Таблица 6
EMBED Equation.3
Уравнение регрессии будет иметь вид: Y= 0,6685+0,8577 ? Х.
Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:
y = 100,6685 ? х0,8577.
Получим уравнение степенной модели регрессии:
y = 4,6611? х0,8577.
Построение показательной функции.
Уравнение показательной кривой: y =а • bх.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения: lg y = lg a + lg x • b.
Обозначим Y= lg y, B= lg b, A= lg a.
Получим линейное уравнение регрессии: Y = A+B•x.
Рассчитаем его параметры, используя данные табл. 7.
EMBED Equation.3
Уравнение будет иметь вид: Y= 1,6402 – 0,0097х
Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:
y =101,6402?(100,0097)х = 43,68? 1,023х.