`По предприятиям лёгкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объёма капиталовложений (X, млн. руб.).
Вариант 1
Требуется:
найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков S2; построить график остатков.
проверит выполнение предпосылок МНК.
осуществить проверку значимости параметров уравнения регрессии с помощью t-критерию Стьюдента (?=0,05).
вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (?=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя EMBED Equation.3 при уровне значимости EMBED Equation.3 , если прогнозное значения фактора Х составит 80% от его максимального значения.
Представить графически: фактические и модельные значения EMBED Equation.3 точки прогноза.
Составить уравнения нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение:
1.Для вычисления параметров модели промежуточные расчеты приведём в виде таблицы (таблица выполнена с помощью средств Excel):
табл.1.1
Определим линейный коэффициент парной корреляции по следующей формуле:
ry,x=??(y-yср)*(x-xср)?/v?(y-yср)2*(x-xср)2=0,994
можно сказать, что связь между объёмом капиталовложений и объёмом выпуска продукции прямая, достаточно сильная.
Уравнение линейной регрессии имеет вид: y=a+b*x.
Значения параметров a и b линейной модели определим, используя данные таблицы 1.1:
b=y*x – y*x / x2 – x 2 = 10062,30 – 70,60*139,10 / 5094,60 – 70,602 = 241,84/110,24 = 2,19
a=y-b*x=139,10-2,19*70,60=-15,514
Уравнение линейной регрессии имеет вид: Y=-15.514+2.19*X
С увеличением объёма капиталовложений на 1 млн. руб. объем выпускаемой продукции увеличится в среднем на 2млн. 190 тыс.руб. Это свидетельствует об эффективной работе предприятия.
2. Вычислим остатки и остаточную сумму квадрвтов с помощью Excel и занесем результаты вычислений в таблицу 2.1:
Табл. 2.1
Дисперсия остатков будет равна:
S2 = (??2) / n-2 = 59,53/8 = 7,44
График остатков имеет вид:
Рис.1

3.Основные предпосылки МНК:
Первое условие: т.к. ??= 0, то M(?)=0,т.е. математическое ожидание случайной составляющей в любом наблюдении равно 0.
Второе условие: в найденной модели Y=-15.514+2.19*X возмущение ? есть величина случайная, а объясняющая переменная x- величина неслучайная. Т.к. на графике (рис.1) нет направленности в расположении точек ?, то ? - случайные величины, и применение МНК оправдано.
Третье условие: d=?( ?i- ?i-1)2 / ? ?i 2, d?2, значит, автокорреляция отсутствует.
Четвёртое условие: т.к. дисперсия случайной величины постоянна для всех наблюдений, то соблюдается условие гомоскедастичность.
4. Коэффициент Стьюдента t? для m=8 степеней свободы уровня значимости ?=0,05 равен 2,3060.
S?=v(S2 * ?x2 )/ n*(?x-xср)2 = 5,86
S?=v S2 / (?x-xср)2 = 0,082
t?=|a| / S?= 15,514/5,86=2,647
t?=|b| / S?= 2,19/0,082=26,707, т.к. t?>tтабл., t?>tтабл., то оба коэффициента считаются значимыми.
5. Коэффициент детерминации равен: R2=1-(??2) / ?(y-yср)2=1-0,011=0,9889.
Проведём оценку значимости уравнения регрессии с помощью F-критерия Фишера:
F=(R2/1-R)*(n-2)=(0,9889/0,011)*8=719,2
F>Fтабл.=5,32 ,для ?=0,05; k1=m=1; k2=n-m-1=8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F>Fтабл.
Определим среднюю относительную ошибку:
Eотн.=1/n*?|(y-yср)/y)|*100%=15,7%.
В среднем расчетные значения Y для линейной модели отличаются от фактических значений на 15,7%.
6. yпрогн.=a+b*xпрогн.
X=80%x=0,8*84=67,2
yпрогн=-15,514+2,19*67,2=131,654
7. Фактические и модельные значения Y, точки прогноза.
Рис.2

8. Гиперболическая модель
Уравнение гиперболической функции: y’=a+b/x.
Произведём линеаризацию модели путем замены X=1/x. В результате получим линейное уравнение: y’=a+b*X.
Рассчитаем его параметры по данным таблицы 3.1:
Табл.3.1
b=[y*X-y*X]/[X^2-X^2]=[1.964817-139.10*0.014493911]/[0.000215038-0.014493911*0.014493911]=-10330.45951
a=y-b*X=139.10+10330.45951*0.0144933911=288.8287607.
Получим следующее уравнение гиперболической модели:
y’=288.829-10330.4595/x, и её график:
Рис.3

Степенная модель
Уравнение степенной модели имеет вид:
Y=a*xb ; для построения этой модели произведём линеаризацию переменных: lgy=lga+b*lgx. Построим таблицу с помощью Excel:
Табл. 3.2
Обозначим Y=lg(y), X=lg(x), A=lg(a). Тогда имеем уравнение: Y=A+bX – линейное уравнение регрессии. Рассчитаем его параметры, используя таблицу 3.3:
Табл. 3.3
b=(Y*X-Y*X)/ X2-X2=(3,94152-1,84*2,14)/3,40097-1,84*1,84=0,00392/0,01537 = 0,25504229
a=y-b*x=2,14-0,25504229*1,84=1,670722186
Y=1,670722186+0,25504229*x
Получим следующее уравнение степенной модели:
y’=101.670722186*x0.25504229=46,85135826*x0.25504229, и её график:
Рис. 4

Показательная модель
Уравнение показательной кривой: y’=a*bx; для построения этой модели произведём линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения: lg(y’)=lg(a)+lg(x)*b
Обозначим: Y=lg(y’) , B=lg(b) , A=lg(a)
Получим линейное уравнение регрессии: Y=A+B*x.
Рассчитаем его параметры, используя данные таблицы 3.4:
Табл.3.4
B=[Y*x-Y*x]/[x^2-x^2]=[151.577-2.14*70.60]/[5094.60-70.60*70.60]=0.496/110.24= 0.004472
A=Y-B*x=2.14-0.004472*70.60=1.82427
Уравнение будет иметь вид:
Y=1.82427+0.004472*x.
Перейдём к исходным переменным x и y, выполнив потенцирование данного уравнения:
y’=101.82427*(100.004472)x=66.722*1.01035x, график показательной модели:
Рис. 5

9. Гиперболическая модель
Определим индекс корреляции, с помощью таблицы 4.1:
Табл. 4.1
?yx=v1-[?(y-y’)^2]/?(y-ycp)^2 =0,9937
Связь между показателем y и фактором x можно считать достаточно сильной.
Индекс детерминации:
R^2= ?yx^2=0,988
Вариация результата Y (объём выпуска продукции) на 98,8% объясняется вариацией фактора X (объёмом капиталовложений).
Средняя относительная ошибка аппроксимации:
A=[1/n]*?|(y-yср)/y)|*100%=66,89/10=6,689%
В среднем расчетные значения y’ для степенной модели отличаются от фактических значений на 6,689%.
Степенная модель
Определим индекс корреляции:
?yx=v1-[?(y-y’)^2]/?(y-ycp)^2 = 0,63638
Связь между показателем y и фактором x можно считать умеренной.
Коэффициент детерминации:
R^2= ?yx^2=0,63638^2=0,40498
Вариация результата Y (объём выпуска продукции) на 40,498% объясняется вариацией фактора X (объёмом капиталовложений).
Средняя относительная ошибка аппроксимации:
A=[1/n]*?|(y-yср)/y)|*100%=119,70/10=11,97%
В среднем расчетные значения y’ для степенной модели отличаются от фактических значений на 11,97%.
Показательная модель
Определим индекс корреляции с помощью таблицы 4.2:
табл.4.2
?yx=v1-[?(y-y’)^2]/?(y-ycp)^2 =0,9285
Связь между показателем y и фактором x можно считать достаточно сильной.
Индекс детерминации:
R^2= ?yx^2=0,9285^2=0,862
Вариация результата Y (объём выпуска продукции) на 86,2% объясняется вариацией фактора X (объёмом капиталовложений).
Средняя относительная ошибка аппроксимации:
A=[1/n]*?|(y-yср)/y)|*100%=56,23/10=5,62%
В среднем расчетные значения y’ для степенной модели отличаются от фактических значений на 5,62%.
Для выбора лучшей модели построим сводную таблицу результатов:
Линейная модель является лучшей для построения прогноза, т.к. характеристики этой модели имеют большее значение, чем у других. Среди нелинейных моделей наиболее точной является гиперболическая модель, в которой значения показателей коэффициента детерминации и индекса корреляции больше, чем у остальных нелинейных моделей.