Тема 5. Економетричні методи прогнозування
1. МЕТОДИЧНІ ПОРАДИ ДО ВИВЧЕННЯ ТЕМИ
З даної теми передбачається вивчення таких питань:
- математичний апарат макроеконометричних моделей прогнозування;
- макропрогнозування на основі регресійної моделі;
- порушення допущень регресійного аналізу;
Для самостійного вивчення цієї теми рекомендується література:[2,4,6,7,9,10].
Вивчення теми надаст студентам можливість знати математичний апарат мокроеконометричного прогнозування, зрозуміти процедуру прогнозування на основі регресійної моделі, вміти конструювати макроеконометричні моделі.
Основу математичного апарату для економетричних моделей
складають такі розділи математичної статистики, як кореляційний і регресійний аналіз.
Кореляційний аналіз забезпечує:
- вимірювання ступеня зв’язку двох або більше змінних;
- відбирання чинників, що найбільш суттєво впливають на залежну змінну;
- знаходження раніше не відомих причинних зв’язків (кореляція
безпосередньо не розкриває причинних зв’язків між явищами, але визначає числове значення цих зв’язків та імовірність суджень щодо їх існування).
Основними засобами аналізу є парні, частинні і множинні коефіцієнти кореляції.
Регресійний аналіз дозволити розв’язувати такі завдання:
- встановлення форм залежності між однією ендогенною та однією або кількома екзогенними змінними (додатна, від’ємна, лінійна, нелінійна). Ендогенна змінна звичайно позначається Y, а екзогенна (ні), які ще інакше називаються регресорами, — X;
- визначення функції регресії. Важливо не тільки вказати загальну тенденцію змінення залежної змінної, а й з’ясувати, який був би вплив на залежну змінну головних чинників, якщо б решта (другорядні, побічні) чинників не змінювалася (перебували на тому ж самому середньому рівні) і були виключені випадкові елементи;
-оцінювання невідомих значень залежної змінної.
Відомі різні види множинної регресії — лінійна, покрокова, гребенева тощо.
Макропрогнозування на основі регресійної моделі. Коли регресійна модель використовується для прогнозування величини Y, при відомих значеннях Х незміщена оцінка точкового прогнозу запишеться так:
, (5.1)
де Xp — заданий на перспективу рядок матриці екзогенних змінних Х при i = p;
Yр — точковий прогноз ендогеної змінної на основі економетричної моделі.
Якість прогнозу тим вища, чим:
повніше виконуються допущення моделі в прогнозований період;
надійніше оцінені параметри моделі;
точніше визначені значення екзогенних змінних для періоду упередження прогнозу.
Зв’язок між ендогенною змінною Y і однією або кількома екзогенними змінними Х може бути нелінійним. Існують два шляхи розв’язання цієї проблеми:
перетворити дані і застосувати лінійну регресію;
застосувати методи нелінійної регресії.
За допомогою коефіцієнтів регресії неможливо порівняти вплив чинників на ендогенну змінну через розбіжність одиниць виміру і ступеня коливання. Порівняльні характеристики можна одержати, розрахувавши коефіцієнти еластичності, бета-коефіцієнти. За їх допомогою можна визначити ранги чинників за ступенем їх впливу на залежну змінну, тобто зіставити їх між собою за величиною цього впливу. Разом з тим не можна безпосередньо оцінити частку впливу певного чинника у загальній дії всіх чинників. З цією метою використовуються дельта-коефіцієнти.
Для економічного тлумачення нелінійних зв’язків користуються коефіцієнтом еластичності, який характеризує відносне змінення залежної змінної при зміні пояснюючої змінної на 1 %. Якщо рівняння регресії має вигляд у = f (х), то коефіцієнт еластичності розраховується як:
. (5.2)
Бета-коефіцієнт. Для усунення різниць у вимірі і ступеня коливання чинників використовується ?-коефіцієнт або коефіцієнт регресії у стандартизованому вигляді:
, (5.3)
де — коефіцієнт регресії біля j-ї змінної;
— оцінка середньоквадратичного відхилення j-ї змінної;
— оцінка середньоквадратичного відхилення залежної змінної.
Коефіцієнт показує, на яку частину величини середньоквадратичного відхилення змінюється середнє значення залежної змінної, коли відповідна незалежна змінна збільшується на одне середньоквадратичне відхилення, а решта незалежних змінних залишається сталими.
Дельта-коефіцієнт. Частка кожного чинника у загальному впливі чинників на залежну змінну становить:
; (5.4)
; ,
де R2 — коефіцієнт множинної детермінації;
rj — коефіцієнт парної кореляції мiж j-м чинником і залежною змінною;
?j – ? - коефіцієнт.
За коректно зробленим аналізом величини дельта-коефіцієнтів додатні, тобто усі коефіцієнти регресії мають той самий знак, що й відповідні парні коефіцієнти кореляції. Але у разі значної корельованості пояснюючих змінних деякі дельта- коефіцієнти можуть бути від’ємними через те, що відповідний коефіцієнт регресії має знак, протилежний парному коефіцієнту кореляції.
Порушення допущень регресійного аналізу. Ускладнення методів оцінювання параметрів рівняння регресії і прогнозування ендогенної змінної породжується невиконанням допущень регресійного аналізу. На особливу увагу заслуговують такі порушення, як мультиколінеарність, гетероскедастичність, автокореляція залишків.
Мультиколінеарність означає корельованість екзогенних змінних. Якщо дві або декілька незалежних змінних у множинній регресії корелюють між собою, регресійна модель не в змозі виділити особистий вплив кожної з них на залежну змінну. Мультиколінеарність особливо часто трапляється в аналізі таких макроекономічних даних, як доходи і виробництво, де інфляція, наприклад, може впливати на обидва ряди. Точного граничного значення рівня кореляції змінних, при якому виникає проблема мультиколінеарності не існує, отже, слід діяти на власний розсуд. При мультиколінеарності коефіцієнти регресії нестабільні як в розумінні статистичної значущості, так і за величиною та знаком, тому вони ненадійні. Значення коефіцієнтів R2 можуть бути високими, але значні і стандартні помилки, звідси і t-критерії малі, що свідчить про незначущість параметрів моделі.
Гетероскедастичність. Залишки з постійною дисперсією називаються гомоскедастичними, якщо ж дисперсія змінюється, то — гетероскедастичними. Гетероскедастичність призводить до втрати коефіцієнтами регресії якості кращих оцінок або оцінок з мінімальною дисперсією, отже вони не ефективні.
Вплив гетероскедастичності на оцінку інтервалу прогнозування і перевірку гіпотези про значущість параметрів моделі полягає в тому, що, хоч параметри не зміщені, дисперсії і стандартні помилки цих параметрів будуть зміщеними. Якщо зміщення від’ємне, то оцінки стандартних помилок будуть меншими за справжні їх значення, а критерій перевірки, t-статистика, буде більшим, ніж насправді. Значить, можливий хибний висновок про значущість параметра. І навпаки, якщо зміщення додатне, то оцінки стандартних помилок будуть більшими за справжні їх значення, а критерій перевірки — меншим. Тоді можна помилково прийняти нульову гіпотезу, коли вона має бути відхилена.
Автокореляція залишків найчастіше виникає, коли макроеконометрична модель будується на основі часових рядів. Якщо існує кореляція між послідовними значеннями деякої екзогенної змінної, то вона спостерігатиметься і стосовно послідовних значень залишків. Автокореляція може бути також наслідком помилкової специфікації моделі і її наявність може означати, що необхідно ввести до моделі додаткову незалежну змінну, або лінійна модель повинна бути нелінійною. Введення змінних із лагами теж може привести до автокореляції.
Залежності між залишками задовольняють авторегресійній схемі. Наприклад, якщо залишок еt знаходиться під впливом залишку з попереднього періоду часу еt–1 і будь-якого значення випадкової змінної ut, то ця залежність запишеться як авторегресійна функція першого порядку (AR1):
, (5.5)
Величина ( характеризує коваріацію залишків.
Якщо б поточна величина залишка знаходилася під впливом двох попередніх залишків, то авторегресійна функція другого порядку (AR2) виглядала б так:
(5.6)
Завдяки регресійній моделі за МНК отримують незміщені оцінки з мінімальною дисперсією тільки тоді, коли залишки незалежні один від одного. Якщо існує автокореляція, то параметри регресії не зміщені, але їх стандартні помилки будуть недооцінені, і перевірка параметрів регресії буде ненадійною.
Перевірка наявності автокореляції першого порядку виконується за критерієм Дарбіна—Уотсона (DW):
. (5.15)
Він може набувати значень з проміжку [0, 4]. Якщо залишки еt є випадковими величинами, нормально розподіленими, а не автокорельованими, то значення DW містяться поблизу двох. При додатній автокореляції DW майже дорівнює нулю, при від’ємній — чотирьом. Фактичні значення критерію порівнюються з критичними (табличними) при заданій кількості спостережень п і числі незалежних змінних k для вибраного рівня значущості . Табличні значення мають нижню межу DW1 і верхню — DW2.
Коли DWфакт < DW1, то залишки мають додатну автокореляцію. Коли DWфакт > 4 – DW1, то залишки мають від’ємну автокореляцію. Якщо DWфакт > DW2, то приймається гіпотеза про відсутність автокореляції. Коли DW1 < DW < DW2, точні висновки не можливі, необхідні подальші дослідження з більшою сукупністю спостережень.
Щоб розв’язати проблему автокореляції, спочатку слід розглянути можливість виключення помилок специфікації моделі. Якщо це не допомагає, можна використати процедуру Кочрена-Оркатта [ ].
2.ТЕМІНОЛОГІЧНИЙ СЛОВНИК
Ендогенна змінна – це змінна, яка відбиває власні властивості об’єкта прогнозування (залежна змінна).
Екзогенна змінна – це змінна (пояснююча змінна), яка відбиває головним чином властивості прогнозного фону (незалежна змінна).
Кореляційний аналіз – це аналіз, якій вивчає кореляційні зв’язки між випадковими величинами.
Кореляційний зв’язок – це зв’язок між двома випадковими величинами, коли математичнє сподівання однієі з них змінюється в залежністі від зміни другої випадкової величини.
Регресійний аналіз – це аналіз форм зв’язку, які відтворюють килькісні співвідношення між випадковими величинами.
Дисперсійний аналіз – це аналіз результатів спостережень, які залежать від різноманітних одночасно діючих чинників, вибір найважливіших чинників та оцінювання їх впливу.
Незміщена оцінка прогнозу – це нульова різниця між математичним сподіванням оцінки і значенням оціненого прогнозу.
Системи сумісних, одночасних рівнянь (структура форма моделі) – це система, у якої одни и те же переменные в одних уравнениях входят в левую часть, а в других – в правую часть уравнений, или одни и те же переменные одновременно рассматриваются как эндогенные в одних уравнениях и как экзогенные в других.
Специфікація моделі – це добір пояснюючих змінних та визначення аналітичної форми залежності між ними.
Автокореляція залишків – це кореляційна залежність між значеннями залишків за поточний і попередньої моментами часу.
Коваріація залишків - рівень взаємозв’язку кожного наступного значення з попереднім екзогенної зміної.
3. ПИТАННЯ ДЛЯ САМОПЕРЕВІРКИ
Теретичні питання
У чому полягає сутність кореляційкого-регресійного аналізу?
У чому полягає сутність дисперсійного аналізу?
Як здійснується прогноз на основі регресійної моделі?
Як можливо порівняти вплив чинників на ендогенну змінну через розбіжність одиниц виміру і степені коливань?
У чому полягає сутність порушення допущень регресійного аналізу і як позбутися від них?
Що таке автокореляція залишків?
Які існують мтеди оцінювання системи одночасних рівнянь?
Якой існує зв’язок між економетричними та одновимірними моделями прогнозування?
4. ПРАКТИЧНІ ЗАВДАННЯ
Завдання 1. Розгляньте наступні моделі регресії, які описують динаміку середньорічної заробітної плати:
модель А Wt = 8,56 + 0,36Pt + 0,74Pt-1 + 0,24Pt-2 -2,53Unt + ,
(tфакт) (2,3) (3,7) (2,8) (-4,1)
R2 = 0,9 d = 1,7;
модель B Wt = 9,1 + 0,32Pt - 2,70Unt + 0,2Wt-1 + ,
(tфакт) (3,5) (- 4,7) (2,7)
R2 = 0,85 d = 2,1,
де Wt - середня заробітна плата в році t;
Рt - індекс цін в році t (У відсотках в порівнянні із базисним періодом);
Unt - рівень безробіття в році t.
Вхідні дані Wt, Рt й Un, зібрані за 30 років (дані щорічні).
1) Використовуючи модель А, охарактеризуйте силу зв’язку між зміненням цін і рівнем середньої зарбітної плати.
2) Використовуючи модель B, охарактеризуйте силу зв’язку між зміненням цін і рівнем середньої зарбітної плати.
Завдання 2. У табл.Д.1.1 і Д.1.9. наведени дені про індекс споживчих цін (Y) і оплату праці найманих працівників (x) за 1996-2001 році. Необхідно:
Для харакреристики залажності Y від х розрахувати параметри наступних функцій: лінейної; степеневої; показательної.
Оцінити кожну модель за середньою похибкою апроксимації і F – критерій Фішера.
Розрахувати прогноз СРІt, якщо прогнозне значення фактора було розраховане у завданні 8 теми 4.
Завдання 3. За даннимі таблиц додатків побудовати богатофакторну
модель залежності ВВП від декільких фокторів. Побудувати матрицу парних коефіціентів кореляції, коефіціенти множінної детермінації, виявити, які фактори мультиколеніарні. Провести аналіз результатів розрахунків.
Завдання 4. По данным, представленным в табл. 5.1( цифри умовні [ ]), изучается зависимость индекса человеческого развития Y от переменных:
x1 - ВВП 1997 г., % к 1990 г.;
x2 - расходы на конечное потребление в текущих ценах, % к ВВП;
х3 - расходы домашних хозяйств, % к ВВП;
х4 - валовое накопление, % к ВВП;
x5 - суточная калорийность питания населения, ккал на душу населения;
x6 - ожидаемая продолжительность жизни при рождении 1997 г. число лет.
Таблиця 5.1.
Страна
Y
x1
x2
х3
х4
x5
x6

Италия
0,900
108,0
78,1
61,8
17,5
3504
78,2

Канада
0,932
113,0
78,6
58,6
19,7
3056
79,0

Казахстан
0,740
71,0
84,0
71,7
18,5
3007
67,6

Китай
0,701
210,0
59,2
48,0
42,4
2844
69,8

Латвия
0,744
94,0
90,2
63,9
23,0
2861
68,4

Нидерланды
0.921
118,0
72,8
59,1
20,2
3259
77,9

Норвегия
0,927
130,0
67,7
47,5
25,2
3350
78,1

Польша
0,802
127,0
82,6
65,3
22,4
3344
72,5

Россия
0,747
61,0
74,4
53,2
22,7
2704
66,6

США
0,927
117,0
83.3
67,9
18,1
3642
76,7

Украина
0,721
46,0
83,7
61,7
20,1
2753
68,8

Финляндия
0,913
107,0
73,8
52,9
17,3
2916
76,8

Франция
0,918
110,0
79,2
59,9
16,8
3551
78,1

Чехия
0,833
99,2
71,5
51,5
29,9
3177
73,9

Швейцария
0.914
101,0
75,3
61,2
20,3
3280
78,6

Швеция
0,923
105,0
79,0
53,1
14,1
3160
78,5

Австрия
0,904
115,0
75,5
56,1
25,2
3343
77,0

Австралия
0,922
123,0
78,5
61,8
21,8
3001
78,2

Белоруссия
0,763
74,0
78,4
59,1
25,7
3101
68,0

Бельгия
0,923
111,0
77,7
63,3
17,8
3543
77,2

Великобритания
0,918
113,0
84,4
64,1
15,9
3237
77,2

Германия
0,906
110,0
75,9
57,0
22,4
3330
77,2

Дания
0,905
119,0
76,0
50,7
20,6
3808
75.7

Индия
0,545
146,0
67,5
57,1
25,2
2415
62,6

Испания
0,894
113,0
78,2
62,0
20,7
3295
78,0

1. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.
3. Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.
4. Отберите информативные факторы по пп.1 и 3. Постройте уравнение регрессии со статистически значимыми факторами.