Тема 5. Економетричні методи прогнозування 1. МЕТОДИЧНІ ПОРАДИ ДО ВИВЧЕННЯ ТЕМИ З даної теми передбачається вивчення таких питань: - математичний апарат макроеконометричних моделей прогнозування; - макропрогнозування на основі регресійної моделі; - порушення допущень регресійного аналізу; Для самостійного вивчення цієї теми рекомендується література:[2,4,6,7,9,10]. Вивчення теми надаст студентам можливість знати математичний апарат мокроеконометричного прогнозування, зрозуміти процедуру прогнозування на основі регресійної моделі, вміти конструювати макроеконометричні моделі. Основу математичного апарату для економетричних моделей складають такі розділи математичної статистики, як кореляційний і регресійний аналіз. Кореляційний аналіз забезпечує: - вимірювання ступеня зв’язку двох або більше змінних; - відбирання чинників, що найбільш суттєво впливають на залежну змінну; - знаходження раніше не відомих причинних зв’язків (кореляція безпосередньо не розкриває причинних зв’язків між явищами, але визначає числове значення цих зв’язків та імовірність суджень щодо їх існування). Основними засобами аналізу є парні, частинні і множинні коефіцієнти кореляції. Регресійний аналіз дозволити розв’язувати такі завдання: - встановлення форм залежності між однією ендогенною та однією або кількома екзогенними змінними (додатна, від’ємна, лінійна, нелінійна). Ендогенна змінна звичайно позначається Y, а екзогенна (ні), які ще інакше називаються регресорами, — X; - визначення функції регресії. Важливо не тільки вказати загальну тенденцію змінення залежної змінної, а й з’ясувати, який був би вплив на залежну змінну головних чинників, якщо б решта (другорядні, побічні) чинників не змінювалася (перебували на тому ж самому середньому рівні) і були виключені випадкові елементи; -оцінювання невідомих значень залежної змінної. Відомі різні види множинної регресії — лінійна, покрокова, гребенева тощо. Макропрогнозування на основі регресійної моделі. Коли регресійна модель використовується для прогнозування величини Y, при відомих значеннях Х незміщена оцінка точкового прогнозу запишеться так: , (5.1) де Xp — заданий на перспективу рядок матриці екзогенних змінних Х при i = p; Yр — точковий прогноз ендогеної змінної на основі економетричної моделі. Якість прогнозу тим вища, чим: повніше виконуються допущення моделі в прогнозований період; надійніше оцінені параметри моделі; точніше визначені значення екзогенних змінних для періоду упередження прогнозу. Зв’язок між ендогенною змінною Y і однією або кількома екзогенними змінними Х може бути нелінійним. Існують два шляхи розв’язання цієї проблеми: перетворити дані і застосувати лінійну регресію; застосувати методи нелінійної регресії. За допомогою коефіцієнтів регресії неможливо порівняти вплив чинників на ендогенну змінну через розбіжність одиниць виміру і ступеня коливання. Порівняльні характеристики можна одержати, розрахувавши коефіцієнти еластичності, бета-коефіцієнти. За їх допомогою можна визначити ранги чинників за ступенем їх впливу на залежну змінну, тобто зіставити їх між собою за величиною цього впливу. Разом з тим не можна безпосередньо оцінити частку впливу певного чинника у загальній дії всіх чинників. З цією метою використовуються дельта-коефіцієнти. Для економічного тлумачення нелінійних зв’язків користуються коефіцієнтом еластичності, який характеризує відносне змінення залежної змінної при зміні пояснюючої змінної на 1 %. Якщо рівняння регресії має вигляд у = f (х), то коефіцієнт еластичності розраховується як: . (5.2) Бета-коефіцієнт. Для усунення різниць у вимірі і ступеня коливання чинників використовується ?-коефіцієнт або коефіцієнт регресії у стандартизованому вигляді: , (5.3) де — коефіцієнт регресії біля j-ї змінної; — оцінка середньоквадратичного відхилення j-ї змінної; — оцінка середньоквадратичного відхилення залежної змінної. Коефіцієнт показує, на яку частину величини середньоквадратичного відхилення змінюється середнє значення залежної змінної, коли відповідна незалежна змінна збільшується на одне середньоквадратичне відхилення, а решта незалежних змінних залишається сталими. Дельта-коефіцієнт. Частка кожного чинника у загальному впливі чинників на залежну змінну становить: ; (5.4) ; , де R2 — коефіцієнт множинної детермінації; rj — коефіцієнт парної кореляції мiж j-м чинником і залежною змінною; ?j – ? - коефіцієнт. За коректно зробленим аналізом величини дельта-коефіцієнтів додатні, тобто усі коефіцієнти регресії мають той самий знак, що й відповідні парні коефіцієнти кореляції. Але у разі значної корельованості пояснюючих змінних деякі дельта- коефіцієнти можуть бути від’ємними через те, що відповідний коефіцієнт регресії має знак, протилежний парному коефіцієнту кореляції. Порушення допущень регресійного аналізу. Ускладнення методів оцінювання параметрів рівняння регресії і прогнозування ендогенної змінної породжується невиконанням допущень регресійного аналізу. На особливу увагу заслуговують такі порушення, як мультиколінеарність, гетероскедастичність, автокореляція залишків. Мультиколінеарність означає корельованість екзогенних змінних. Якщо дві або декілька незалежних змінних у множинній регресії корелюють між собою, регресійна модель не в змозі виділити особистий вплив кожної з них на залежну змінну. Мультиколінеарність особливо часто трапляється в аналізі таких макроекономічних даних, як доходи і виробництво, де інфляція, наприклад, може впливати на обидва ряди. Точного граничного значення рівня кореляції змінних, при якому виникає проблема мультиколінеарності не існує, отже, слід діяти на власний розсуд. При мультиколінеарності коефіцієнти регресії нестабільні як в розумінні статистичної значущості, так і за величиною та знаком, тому вони ненадійні. Значення коефіцієнтів R2 можуть бути високими, але значні і стандартні помилки, звідси і t-критерії малі, що свідчить про незначущість параметрів моделі. Гетероскедастичність. Залишки з постійною дисперсією називаються гомоскедастичними, якщо ж дисперсія змінюється, то — гетероскедастичними. Гетероскедастичність призводить до втрати коефіцієнтами регресії якості кращих оцінок або оцінок з мінімальною дисперсією, отже вони не ефективні. Вплив гетероскедастичності на оцінку інтервалу прогнозування і перевірку гіпотези про значущість параметрів моделі полягає в тому, що, хоч параметри не зміщені, дисперсії і стандартні помилки цих параметрів будуть зміщеними. Якщо зміщення від’ємне, то оцінки стандартних помилок будуть меншими за справжні їх значення, а критерій перевірки, t-статистика, буде більшим, ніж насправді. Значить, можливий хибний висновок про значущість параметра. І навпаки, якщо зміщення додатне, то оцінки стандартних помилок будуть більшими за справжні їх значення, а критерій перевірки — меншим. Тоді можна помилково прийняти нульову гіпотезу, коли вона має бути відхилена. Автокореляція залишків найчастіше виникає, коли макроеконометрична модель будується на основі часових рядів. Якщо існує кореляція між послідовними значеннями деякої екзогенної змінної, то вона спостерігатиметься і стосовно послідовних значень залишків. Автокореляція може бути також наслідком помилкової специфікації моделі і її наявність може означати, що необхідно ввести до моделі додаткову незалежну змінну, або лінійна модель повинна бути нелінійною. Введення змінних із лагами теж може привести до автокореляції. Залежності між залишками задовольняють авторегресійній схемі. Наприклад, якщо залишок еt знаходиться під впливом залишку з попереднього періоду часу еt–1 і будь-якого значення випадкової змінної ut, то ця залежність запишеться як авторегресійна функція першого порядку (AR1): , (5.5) Величина ( характеризує коваріацію залишків. Якщо б поточна величина залишка знаходилася під впливом двох попередніх залишків, то авторегресійна функція другого порядку (AR2) виглядала б так: (5.6) Завдяки регресійній моделі за МНК отримують незміщені оцінки з мінімальною дисперсією тільки тоді, коли залишки незалежні один від одного. Якщо існує автокореляція, то параметри регресії не зміщені, але їх стандартні помилки будуть недооцінені, і перевірка параметрів регресії буде ненадійною. Перевірка наявності автокореляції першого порядку виконується за критерієм Дарбіна—Уотсона (DW): . (5.15) Він може набувати значень з проміжку [0, 4]. Якщо залишки еt є випадковими величинами, нормально розподіленими, а не автокорельованими, то значення DW містяться поблизу двох. При додатній автокореляції DW майже дорівнює нулю, при від’ємній — чотирьом. Фактичні значення критерію порівнюються з критичними (табличними) при заданій кількості спостережень п і числі незалежних змінних k для вибраного рівня значущості . Табличні значення мають нижню межу DW1 і верхню — DW2. Коли DWфакт < DW1, то залишки мають додатну автокореляцію. Коли DWфакт > 4 – DW1, то залишки мають від’ємну автокореляцію. Якщо DWфакт > DW2, то приймається гіпотеза про відсутність автокореляції. Коли DW1 < DW < DW2, точні висновки не можливі, необхідні подальші дослідження з більшою сукупністю спостережень. Щоб розв’язати проблему автокореляції, спочатку слід розглянути можливість виключення помилок специфікації моделі. Якщо це не допомагає, можна використати процедуру Кочрена-Оркатта [ ]. 2.ТЕМІНОЛОГІЧНИЙ СЛОВНИК Ендогенна змінна – це змінна, яка відбиває власні властивості об’єкта прогнозування (залежна змінна). Екзогенна змінна – це змінна (пояснююча змінна), яка відбиває головним чином властивості прогнозного фону (незалежна змінна). Кореляційний аналіз – це аналіз, якій вивчає кореляційні зв’язки між випадковими величинами. Кореляційний зв’язок – це зв’язок між двома випадковими величинами, коли математичнє сподівання однієі з них змінюється в залежністі від зміни другої випадкової величини. Регресійний аналіз – це аналіз форм зв’язку, які відтворюють килькісні співвідношення між випадковими величинами. Дисперсійний аналіз – це аналіз результатів спостережень, які залежать від різноманітних одночасно діючих чинників, вибір найважливіших чинників та оцінювання їх впливу. Незміщена оцінка прогнозу – це нульова різниця між математичним сподіванням оцінки і значенням оціненого прогнозу. Системи сумісних, одночасних рівнянь (структура форма моделі) – це система, у якої одни и те же переменные в одних уравнениях входят в левую часть, а в других – в правую часть уравнений, или одни и те же переменные одновременно рассматриваются как эндогенные в одних уравнениях и как экзогенные в других. Специфікація моделі – це добір пояснюючих змінних та визначення аналітичної форми залежності між ними. Автокореляція залишків – це кореляційна залежність між значеннями залишків за поточний і попередньої моментами часу. Коваріація залишків - рівень взаємозв’язку кожного наступного значення з попереднім екзогенної зміної. 3. ПИТАННЯ ДЛЯ САМОПЕРЕВІРКИ Теретичні питання У чому полягає сутність кореляційкого-регресійного аналізу? У чому полягає сутність дисперсійного аналізу? Як здійснується прогноз на основі регресійної моделі? Як можливо порівняти вплив чинників на ендогенну змінну через розбіжність одиниц виміру і степені коливань? У чому полягає сутність порушення допущень регресійного аналізу і як позбутися від них? Що таке автокореляція залишків? Які існують мтеди оцінювання системи одночасних рівнянь? Якой існує зв’язок між економетричними та одновимірними моделями прогнозування? 4. ПРАКТИЧНІ ЗАВДАННЯ Завдання 1. Розгляньте наступні моделі регресії, які описують динаміку середньорічної заробітної плати: модель А Wt = 8,56 + 0,36Pt + 0,74Pt-1 + 0,24Pt-2 -2,53Unt + , (tфакт) (2,3) (3,7) (2,8) (-4,1) R2 = 0,9 d = 1,7; модель B Wt = 9,1 + 0,32Pt - 2,70Unt + 0,2Wt-1 + , (tфакт) (3,5) (- 4,7) (2,7) R2 = 0,85 d = 2,1, де Wt - середня заробітна плата в році t; Рt - індекс цін в році t (У відсотках в порівнянні із базисним періодом); Unt - рівень безробіття в році t. Вхідні дані Wt, Рt й Un, зібрані за 30 років (дані щорічні). 1) Використовуючи модель А, охарактеризуйте силу зв’язку між зміненням цін і рівнем середньої зарбітної плати. 2) Використовуючи модель B, охарактеризуйте силу зв’язку між зміненням цін і рівнем середньої зарбітної плати. Завдання 2. У табл.Д.1.1 і Д.1.9. наведени дені про індекс споживчих цін (Y) і оплату праці найманих працівників (x) за 1996-2001 році. Необхідно: Для харакреристики залажності Y від х розрахувати параметри наступних функцій: лінейної; степеневої; показательної. Оцінити кожну модель за середньою похибкою апроксимації і F – критерій Фішера. Розрахувати прогноз СРІt, якщо прогнозне значення фактора було розраховане у завданні 8 теми 4. Завдання 3. За даннимі таблиц додатків побудовати богатофакторну модель залежності ВВП від декільких фокторів. Побудувати матрицу парних коефіціентів кореляції, коефіціенти множінної детермінації, виявити, які фактори мультиколеніарні. Провести аналіз результатів розрахунків. Завдання 4. По данным, представленным в табл. 5.1( цифри умовні [ ]), изучается зависимость индекса человеческого развития Y от переменных: x1 - ВВП 1997 г., % к 1990 г.; x2 - расходы на конечное потребление в текущих ценах, % к ВВП; х3 - расходы домашних хозяйств, % к ВВП; х4 - валовое накопление, % к ВВП; x5 - суточная калорийность питания населения, ккал на душу населения; x6 - ожидаемая продолжительность жизни при рождении 1997 г. число лет. Таблиця 5.1. Страна Y x1 x2 х3 х4 x5 x6
Италия 0,900 108,0 78,1 61,8 17,5 3504 78,2
Канада 0,932 113,0 78,6 58,6 19,7 3056 79,0
Казахстан 0,740 71,0 84,0 71,7 18,5 3007 67,6
Китай 0,701 210,0 59,2 48,0 42,4 2844 69,8
Латвия 0,744 94,0 90,2 63,9 23,0 2861 68,4
Нидерланды 0.921 118,0 72,8 59,1 20,2 3259 77,9
Норвегия 0,927 130,0 67,7 47,5 25,2 3350 78,1
Польша 0,802 127,0 82,6 65,3 22,4 3344 72,5
Россия 0,747 61,0 74,4 53,2 22,7 2704 66,6
США 0,927 117,0 83.3 67,9 18,1 3642 76,7
Украина 0,721 46,0 83,7 61,7 20,1 2753 68,8
Финляндия 0,913 107,0 73,8 52,9 17,3 2916 76,8
Франция 0,918 110,0 79,2 59,9 16,8 3551 78,1
Чехия 0,833 99,2 71,5 51,5 29,9 3177 73,9
Швейцария 0.914 101,0 75,3 61,2 20,3 3280 78,6
Швеция 0,923 105,0 79,0 53,1 14,1 3160 78,5
Австрия 0,904 115,0 75,5 56,1 25,2 3343 77,0
Австралия 0,922 123,0 78,5 61,8 21,8 3001 78,2
Белоруссия 0,763 74,0 78,4 59,1 25,7 3101 68,0
Бельгия 0,923 111,0 77,7 63,3 17,8 3543 77,2
Великобритания 0,918 113,0 84,4 64,1 15,9 3237 77,2
Германия 0,906 110,0 75,9 57,0 22,4 3330 77,2
Дания 0,905 119,0 76,0 50,7 20,6 3808 75.7
Индия 0,545 146,0 67,5 57,1 25,2 2415 62,6
Испания 0,894 113,0 78,2 62,0 20,7 3295 78,0
1. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов. 3. Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. 4. Отберите информативные факторы по пп.1 и 3. Постройте уравнение регрессии со статистически значимыми факторами.