5. МЕТОДИЧНІ ВКАЗІВКИ ДО ВИКОНАННЯ МОДУЛЬНИХ ЛАБОРАТОРНИХ РОБІТ 5.1. Мета підготовки модульних робіт Метою лабораторних робот є поглиблення і закріплення студентами теоретичних знань з макроекономічного прогнозування та набуття вмінь пов’язувати свої знання з практикою. Виконання модульних лабораторних робіт дає студентові можливість навчитися самостійно використовувати й узагальнювати теоретичні положення та інформаційні матеріали, формувати власні припущення стосовно гіпотез розвитку об’єкта або процесу в майбутньому та обґрунтовувати висновки й пропозиції, спрямовані на їх вирішення. Дані для виконання модульних лабораторних робіт надаються у таблицях загальноекономічних показників (додатків). 5.2. Зразок виконання модульної лабораторної роботи № 1 МОДУЛЬНА ЛАБОРАТОРНА РОБОТА № 1 ПРОГНОЗУВАННЯ ОСНОВНИХ МАКРОЕКОНОМІЧНИХ ПОКАЗНИКІВ Модульна робота складається з трьох частин: «Екстраполяція трендів на основі регресійного аналізу»; «Декомпозиційний аналіз часових рядів»; «Згладжування часових рядів». Завдання 1. Прогнозування індексу реального ВВП на основі екстраполяції трендів Етапи виконання роботи 1. Постановка завдання прогнозування. 2. Оцінювання трендів. 3. Статистичний аналіз моделей та оцінка прогнозів. 4. Аналіз результатів моделювання. 5. Прогнозування індексу реального ВВП. Етап 1. Постановка завдання прогнозування На основі статистичних даних щорічного обсягу ВВП за період 1983—1995 рр. порівняно з 1990 р. і в цінах 1990 р. (табл. 1) дати оцінку тренду, використовуючи дані за 1983—1993 рр., а потім за допомогою цих оцінок спрогнозувати ВВП на 1994 та 1995 рр. й визначити прогнозну якість побудованої моделі. Таблиця 1 ВАЛОВИЙ ВНУТРІШНІЙ ПРОДУКТ (1990 р. =100 %) Рік t Yt (ВВП) Рік t Yt (ВВП)
1983 1 94,1 1990 8 100,0
1984 2 92,3 1991 9 98,8
1985 3 91,5 1992 10 101,9
1986 4 94,1 1993 11 103,0
1987 5 96,3 1994 12 106,4
1988 6 99,7 1995 13 110,3
1989 7 102,5
Етап 2. Оцінювання трендів 1. Вводяться дві гіпотези. Перша гіпотеза: між показником Y та чинником t існує лінійна стохастична залежність (модель 1), яка описується простою лінійною регресією . (1) Друга гіпотеза: між показником Y та чинником t існує нелінійна стохастична залежність (модель 2), яка описується експоненційною функцією . (2) 2. Формуємо інформаційну базу розрахунків у системі STATISTIKA або у програмі обробки електронних таблиць Microsoft Excel — блок вхідних даних, блок проміжних та прогнозних розрахунків. 3. Розраховуємо оцінки параметрів тренду за моделлю 1: . (3) За рівнянням (3) розраховуємо тренд ВВП () та прогнозні значення показника. 4. Розраховуємо оцінки параметрів тренду за моделлю 2 (що відповідає ): . (4) За рівнянням (4) розраховуємо тренд ВВП () та прогнозні значення показника. Етап 3. Статистичний аналіз моделей або оцінка прогнозів 1. Формування числових даних статистичного аналізу. 2. Розрахунок основних показників адекватності прогнозованих моделей. 3. Розрахунок основних показників точності прогнозованих моделей. 4. Насамперед перевіряємо відповідність випадкової компоненти нормальному закону розподілу за допомогою показників асиметрії та ексцесу за формулами: ; ; (5) ; , (6) де — вибіркова характеристика асиметрії; — вибіркова характеристика ексцесу; і — відповідні середньоквадратичні помилки. Якщо одночасно виконуються такі нерівності: ; , (7) то гіпотеза про нормальний характер розподілу випадкової компоненти приймається. Якщо виконується хоча б одна з цих нерівностей ; , (8) то гіпотеза про нормальний характер розподілу відхиляється, трендова модель визнається неадекватною. Для моделі 1: , ; , ; моделі 2: , ; , . Оскільки одночасно виконуються нерівності (7), тобто обидві моделі (1 і 2) визнаються адекватними. Показники точності прогнозованих моделей та прогнозів розраховуються за формулами табл. 2. Таблиця 2 Показники Формула Модель 1 Модель 2
SSE
37,638 37,937
SSR
137,089 137,976
SST
174,727 175,913
R2
0,785 0,784
R
0,886 0,885
t
0,886 0,887
MAE
1,439 1,448
MSE
4,182 4,215
Закінчення табл. 2 Показники Формула Модель 1 Модель 2
MSR
137,090 188,892
RMSE
2,045 2,063
RMSPE
0,190 0,191
F
32,781 44,812
DW
1,222 1,206
t0
68,780 330,821
t1
5,725 5,725
Етап 4. Аналіз результатів моделювання Оцінки параметрів у моделях 1 і 2 дорівнюють відповідно: = 90,95636 + 1,116364 ( t, (68,779) (5,725) R2 = 0, 78, значення статистики Дарбіна—Уотсона = 1, 22;
(330,82) (5,725) R2 = 0,78, значення статистики Дарбіна—Уотсона = 1, 20. Числа в дужках є значеннями t-статистики для перевірки гіпотези про рівність 0 відповідних коефіцієнтів. Такі великі значення (більші за 2,622 для 9 ступенів свободи в даному прикладі) означають, що гіпотезу про їх рівність 0 треба відхилити. Мірою згоди є множинний коефіцієнт кореляції R2, скоригований за ступенями свободи, для якого близькі до 1 значення вказують на тісний зв’язок між залежною та незалежною змінними — відповідно Y та t. Статистика Дарбіна—Уотсона перевіряє присутність автокореляції першого порядку, різновид невипадковості залишків. Значення, близькі до 2, вказують на відсутність автокореляції, тоді як низькі (як у даному прикладі) або високі рівні значень свідчать про структурованість залишків. За таких умов стандартні припущення класичної регресії не виконуються, зокрема значення t-статистики оманливе і прогноз неточний. З лінійного рівняння (1) випливає, що індекс реального ВВП зростає в середньому на 1,11 відсотка щорічно, а за (2) оцінка темпу зростання дорівнює ехр 0,011472 — 1,01 відсотка щорічно. Міри точності прогнозів, як ми бачимо, майже однакові для моделей (1) та (2) і показують, що за даними 1983—1993 рр.жодна з цих моделей не має переваги. Порівнюючи різні міри точності, ми бачимо, що величини RMSE та RMSPE мало відрізняються, оскільки фактичні значення близькі до 100, тоді як МАЕ менша за рахунок відсутності ефекту від піднесення до квадрата великих похибок. Незважаючи на порівняно великі значення коефіцієнтів кореляції у моделях (1) та (2), мале значення статистики Дарбіна—Уотсона показує, що залишки автокорельовані і невипадкові, отже, прогнози за цими рівняннями не будуть коректними. Один з можливих шляхів виходу з цієї ситуації — спроба позбутися невипадковості залишків підбором нелінійних трендів. Однак для повноти аналізу ми використаємо наші рівняння для прогнозу ВВП на 1994 та 1995 рр. Етап 5. Прогнозування індексу реального ВВП Одиницею виміру незалежної змінної є інтервал довжиною в рік. Оскільки реєстрація даних проводилась починаючи з 1983 р. (для 1983 р. t = 1), маємо для 1994 р. t = 12, для 1995 р. t = 13. Для 1994 р. з моделі 1 маємо прогнозоване значення 104,3, тоді як справжнє — 106,4. На 1995 р. одержуємо 105,5 замість 110,3. Таким чином, передбачувані зміни дорівнюють 1,11 щорічно проти справжніх значень 2,7 та 3,7. Аналогічно, з моделі 2 для t = 12 маємо прогноз LnY = 4,649432, або = 104,52, і для t = 13 прогноз LnY = 4,660904 дає значення = 105,7. Довірчі інтервали для прогнозів, розрахованих за двома моделями, визначаються за формулою (9) і подаються у табл. 3. . (9) Таблиця 3 Рік t Верхня межа Точковий прогноз Нижня межа
Модель 1 ()
1994 12 110,1 104,35 98,6
1995 13 111,8 105,47 99,1
Модель 2 ()
1994 12 110,3 104,53 98,7
1995 13 112,1 105,73 99,3
Висновок з наведених результатів такий, що прості екстраполяційні моделі ВВП не дозволяють отримати добрий прогноз або економічне зростання у 1994 та 1995 рр. було виключним порівняно з періодом 1983—1993 рр. Як запропоновано раніше, якщо на даному етапі не одержується задовільна модель, її потрібно переоцінити з використанням усієї множини даних (за 1983—1995 рр.) і потім зробити прогноз. Завдання 2. Прогнозування бюджетних видатків на економіку та підтримку зовнішньої торгівлі на основі декомпозиційного аналізу Етапи виконання роботи 1. Постановка завдання прогнозування. 2. Використання адитивної та мультиплікативної моделей аналізу для подальшого прогнозу. 3. Прогнозування бюджетних видатків на економіку та підтримку зовнішньої торгівлі на липень—вересень та жовтень—грудень 1998 р. Етап 1. Постановка завдання прогнозування Необхідно проаналізувати наведену множину даних — бюджетні видатки на економіку та підтримку зовнішньої торгівлі у відсотках ВВП за останні 18 кварталів (табл. 4), та встановити, чи можна виявити тенденцію. Якщо стійка тенденція дійсно існує, потрібно використати побудовану модель для прогнозування показника у наступних кварталах. Таблиця 4 Період № періоду Бюджетні видатки (БВ)
Січень—березень 1994 1 8,6
Квітень—червень 2 9,5
Липень—вересень 3 6,7
Жовтень—грудень 4 20,9
Січень—березень 1995 5 6,7
Квітень—червень 6 18,2
Липень—вересень 7 14,8
Жовтень—грудень 8 9,2
Січень—березень 1996 9 10,2
Квітень—червень 10 22
Липень—вересень 11 39,1
Жовтень—грудень 12 15,7
Січень—березень 1997 13 7,1
Квітень—червень 14 7,6
Липень—вересень 15 8,5
Жовтень—грудень 16 7,4
Січень—березень 1998 17 3,7
Квітень—червень 18 5,2
Етап 2. Використання адитивної та мультиплікативної моделей аналізу для подальшого прогнозу Розв’язування завдання включає п’ять кроків: розрахунок значень сезонної або циклічної компоненти; десезоналізація даних, розрахунок тренду; розрахунок похибок; розрахунок середнього відхилення або середньоквадратичної похибки; прогнозування. Припустимо, що циклічна варіація не враховується, адже моделюється короткий проміжок часу. Моделі аналізу та прогнозу БВ Моделі фактичних значень змінної А можна подати так: адитивна модель А = Т + S + E; (10) мультиплікативна модель А = A ( T ( S. (11) Алгоритм реалізації моделей Крок І. Розрахунок сезонної компоненти. Для того щоб виключити вплив сезонної компоненти, скористаємося методом ковзкої середньої. Підсумуємо перші чотири значення та отримаємо загальний обсяг продажу в 1994 р. Якщо поділити цю суму на чотири, можна знайти середній обсяг продажів у кожному кварталі 1994 р., тобто (8,6 + 9,5 + 6,7 + 20,9)/4 = 11,425. Одержане значення вже не містить сезонної компоненти, оскільки являє собою середню величину за рік. У нас з’явилась оцінка значення тренду для середини року, тобто для точки, яка лежить в середині між кварталами ІІ і III. Якщо послідовно пересуватися вперед з інтервалом у три місяці, можна розрахувати середні квартальні значення на інтервалі: квітень 1994 р. — березень 1995 р. (10,95), липень 1994 р. — червень 1995 р. (13,125) тощо. Дана процедура дозволяє генерувати ковзкі середні за чотирма точками для заданої множини даних. Одержана множина ковзких середніх є найкращою оцінкою прогнозного тренду. На жаль, оцінки значень тренду, одержані в результаті розрахунку ковзних середніх за чотирма точками, належать до інших моментів часу, ніж фактичні дані. Перша оцінка — 11,425 являє собою точку, яка збігається з серединою 1994 р., тобто знаходиться в середині інтервалу фактичних значень бюджетних видатків у II та III кварталах. Друга оцінка — 10,95 лежить між фактичними значеннями у III та IV кварталах. Нам же потрібні десезоналізовані середні значення, що відповідають тим самим інтервалам часу, що й фактичні значення за квартал. Положення десезоналізованих середніх у часі посувається шляхом подальшого розрахунку середніх для кожної пари значень. Знайдемо середню з першої та другої оцінок, центруючи їх на липень—вересень 1994 р., тобто (11,425 + 10,95) / 2 = 11,1875. Це і є десезоналізована середня за липень—вересень 1994 р. Цю десезоналізовану величину, яка називається центрованою ковзною середньою, можна безпосередньо порівнювати з фактичним значенням за липень—вересень 1994 р., який дорівнював 6,7. Зауважимо, що оцінки тренду за перші два або останні два квартала часового ряду будуть відсутні. Далі одержані значення тренду можна використати для знаходження оцінок сезонної компоненти для (10) та (11). Розраховуємо: A – T = S + E, (12) A / T = S ( E. (13) Результати цих розрахунків наведені в табл. 5. Таблиця 5 ДЕСЕЗОНАЛІЗАЦІЯ ДАНИХ В РОЗРАХУНКУ ТРЕНДУ Бюджетні видатки на економіку та підтримку зовнішньої торгівлі (БВ) у % ВВП
Період t Бюджетні видатки Разом за 4 кв. Ковзні середні ЦентрованіКС Коефіцієнт сезонності A – T = S + E Коефіцієнт сезонності А / Т = S · E
Січень—березень 1994 1 8,600
Квітень—червень 2 9,500
45,700 11,425
Липень—вересень 3 6,700
11,1875 –4,488 0,599
43,800 10,95
Жовтень—грудень 4 20,900
12,0375 8,863 1,736
52,500 13,125
Січень—березень 1995 5 6,700
14,1375 –7,438 0,474
60,600 15,15
Квітень—червень 6 18,200
13,6875 4,513 1,330
48,900 12,225
Липень—вересень 7 14,800
12,6625 2,138 1,169
52,400 13,1
Жовтень—грудень 8 9,200
13,5750 –4,375 0,678
56,200 14,05
Січень—березень 1996 9 10,200
17,0875 –6,888 0,597
80,500 20,125
Квітень—червень 10 22,000
20,9375 1,063 1,051
87,000 21,75
Закінчення табл. 5 Період t Бюджетні видатки Разом за 4 кв. Ковзні середні ЦентрованіКС Коефіцієнт сезонності A – T = S + E Коефіцієнт сезонності А / Т = S · E
Липень—вересень 11 39,100
21,3625 17,738 1,830
83,900 20,975
Жовтень—грудень 12 15,700
18,2250 –2,525 0,861
61,900 15,475
Січень—березень 1997 13 7,100
12,6000 –5,500 0,563
38,900 9,725
Квітень—червень 14 7,600
8,6875 –1,088 0,875
30,600 7,65
Липень—вересень 15 8,500
7,2250 1,275 1,176
27,200 6,8
Жовтень—грудень 16 7,400
5,8500 1,550 1,265
19,600 4,9
Січень—березень 1998 17 3,700
Квітень—червень 18 5,200
Для кожного кварталу маємо оцінки сезонної компоненти, які містять помилку або залишок. Перш ніж ми зможемо використати сезонну компоненту, треба зробити два такі виправлення. Знайдемо середні значення сезонних оцінок для кожного сезону року кожної моделі. Ця процедура дасть змогу зменшити деякі значення помилок. Нарешті, виправимо середні значення, збільшуючи або зменшуючи їх на одне й те саме число таким чином, щоб загальна їх сума була нульовою. Це необхідно для усереднення значення сезонної компоненти в цілому за рік. Процедура виправлення наведена в табл. 6. Сума оцінок сезонних компонент ділиться на 4 і віднімається від кожної квартальної оцінки. В останньому рядку табл. 6 відкориговані оцінки записані під відповідними квартальними значеннями. Оскільки значення сезонної компоненти моделі 2 — це частки, а кількість сезонів дорівнює чотирьом, необхідно, щоб їх сума дорівнювала 4, а не 0, як в моделі 1. Оскільки ця сума дорівнює 3,959, а не 4, то значення кожної сезонної компоненти діляться на коефіцієнт k, який дорівнює 3,959/4 = 0,99. Таблиця 6 ПРОЦЕДУРА ВИПРАВЛЕННЯ СЕЗОННОЇ КОМПОНЕНТИ Розрахунок середніх значень сезонної компоненти моделі 1 j i Квартал
Скоригована сезонна компонента 0,551 1,096 1,206 1,146 Сума = 3,999
Крок ІІ. Десезоналізація даних у розрахунку тренду. Процедура полягає у відніманні відповідних значень сезонної компоненти з фактичних значень даних за кожний квартал, тобтоA – S = Т + Е, A / S = T · E, що показано в табл. 7. Таблиця 7 УСУНЕННЯ СЕЗОННОЇ КОМПОНЕНТИ Період t Бюджетнівидатки Сезонна компонента моделі 1 БВ без сезонної компоненти Сезонна компонента моделі 2 БВ без сезонної компоненти
Рис. 1. Підбір тренду десезоналізованих рядів 1, 2 Нові оцінки значень тренду, які ще містять помилку, можна використати для побудови моделі основного тренду. Рівняння лінії тренду має вигляд: Y = b0 + b1x + b2x2 + b3x3 + b4x4, (14) де b0 і bi — оцінки параметрів рівняння регресії, які розраховуються за МНК; x — порядковий номер квартала; Y1 — значення (Т + Е); Y2 — значення (Т · Е) (табл. 8). Отже, рівняння моделі 1 тренду має такий вигляд: (15) Отже, рівняння моделі 2 тренду має такий вигляд: (16) Крок ІІІ. Розрахунок помилок. Цей етап передує розробці прогнозу і складається з розрахунку помилок або залишків (табл. 8): А – T – S = E; (17) A / (T · S) = E. (18) Значення S було знайдено на кроці І, а значення Т на кроці ІІ. Віднімаючи кожне з них від фактичних даних про бюджетні видатки, одержимо значення помилок (табл. 8). Таблиця 8 РОЗРАХУНОК ПОМИЛОК ДЛЯ АДИТИВНОЇ ТА МУЛЬТИПЛІКАТИВНОЇ МОДЕЛЕЙ Період t Бюджетнівидатки Сезонні компоненти моделі 1 Трендове значення Помилка Сезонні компоненти моделі 2 Трендове значення Помилка
Закінчення табл. 8 Період t Бюджетнівидатки Сезонні компоненти моделі 1 Трендове значення Помилка Сезонні компоненти моделі 2 Трендове значення Помилка
Крок IV. Розрахунок MAD і MSE. Для розрахунку середнього абсолютного відхилення та середньої квадратичної похибки використовуємо розрахункові дані табл. 8. Модель 1:
У даному випадку похибки надто великі і становлять більш ніж 36 %. Тенденція, що спостерігається за фактичними даними, не стійка і отримати задовільні короткострокові прогнози неможливо. Модель 2: . У даному випадку похибки досить малі порівняно з адитивною моделлю. Отже, можна стверджувати, що тенденція, виявлена з фактичних даних, відносно стійка і дозволяє одержати задовільні короткострокові прогнози. Етап 3. Прогнозування бюджетних видатків на економіку та підтримку зовнішньої торгівлі на липень—вересень та жовтень—грудень 1998 р. Прогнозні значення показника розраховуються за моделлю з мультиплікативною компонентою F = T · S (% за квартал), де трендове значення Т ( номер квартала, а сезонна компонента S становить: 0,551 у січні—березні; 1,096 у квітні—червні; 1,206 у липні—вересні; 1,146 у жовтні—грудні. Порядковий номер кварталу, який охоплює найближчі три місяці з липня—вересня 1998 р., дорівнює 19, таким чином прогнозне трендове значення становить: Т19 = 22,036 – 10,273 · 19 +2,5165 · 192 – 0,2026 · 193 ++ 0,0051 · 194 = 9,4596.
Рис. 2. Графік апроксимації та прогнозу бюджетних видатків Відповідна сезонна компонента дорівнює 1,206. Отже, прогноз на цей квартал визначається так: F (липень—вересень 1998 р.) 9,4596 · 1,206 = 11,408 %; Т20 = 22,733 – 10,153 · 19 +2,4451 · 192 – 0,1956 · 193 ++ 0,0049 · 194 = 16,913. Відповідна сезонна компонента дорівнює 1,146. Отже, прогноз на цей квартал визначається так: F (жовтень—грудень 1998 р.) 16,913 · 1,146 = 19,382 %. Завдання 3. Прогнозування бюджетних видатків на економіку та підтримку зовнішньої торгівлі за допомогою простого експоненційного згладжування Зробити прогноз за даними бюджетних видатків на економіку та підтримку зовнішньої торгівлі (завдання 2, етап 1. Постановка завдання прогнозування) за допомогою простого лінійного експоненційного згладжування. . (19) Прогноз на момент (t + 1) дорівнює сумі прогнозу на момент t і доданку, пропорційному його помилці. У статистичній літературі цей доданок прийнято називати компонентом «корекції помилки», коефіцієнт ( визначає швидкість, з якою новий прогноз пристосовується до помилки, якщо ( = 0, то пристосування немає, якщо ж ( = 1, то має місце повне пристосування. Щоб використати формулу (19) для прогнозування, потрібно знати значення початкового прогнозу . За початковий прогноз можна взяти середнє значення кількох перших членів ряду або найбільш давнє фактичне значення. Величину ( можна визначити засобом випробувань, послідовно прирівнюючи (, наприклад, до 0,1; 0,3; 0,5; 0,7; 0,9 і порівнюючи згладжені ряди з фактичними даними (тобто мінімізуючи RMSE або іншу характеристику помилки). У табл. 9 фактичні дані у стовпчику (3) не містять явного тренду. У стовпчиках (4) (5) (6) початковий прогноз (на I квартал 1995 р.) прирівняно до 11,425, тобто до середнього значення показників за чотири квартали 1994 р. Розраховуємо за методом експоненційного згладжування три згладжені ряди, котрі відрізняються один від одного параметром згладжування. У стовпчику (4) ( = 0,3; у стовпчику (5) ( = 0,7; у стовпчику (6) ( = 0,5.Наприклад, для ( = 0,3 експоненційне згладжене на II кв. 1995 р. дорівнює . Прогноз на III кв. 1998 р. розраховується аналогічно. Оскільки значення y на III кв. 1998 р. невідоме, всі прогнози на більш віддалене майбутнє так само дорівнюють прогнозу на III кв. 1998 р. Отже, метод експоненційного згладжування в основному придатний до ситуації, коли у послідовні моменти часу потрібні прогнози на один крок вперед. У виборі початкового прогнозу та значення ( є певна частка довільності. Вибір початкового значення стає менш важливим зі зростанням довжини ряду фактичних значень, доступних у процесі побудови прогнозу. У табл. 10 початковий прогноз був прийнятий на рівні фактичного значення за І квартал 1995р., значення коефіцієнтів згладжування ( залишилися такими самими, як у табл. 9. У результаті зміни величини початкового прогнозу згладжені ряди табл. 9 та 10 для однакових ( майже не відрізняються один від одного. Значення RMSE для трьох згладжених рядів за різними ( також не набагато відрізняються. Можна віддати деяку перевагу згладженому ряду табл. 9 зі значенням ( = 0,5, де RMSE має найменшу величину. Прогноз бюджетних видатків на економіку та підтримку зовнішньої торгівлі у IV кв. 1998 р., зроблений за цим рядом, становить 5,67 % від ВВП. При відносно короткому горизонті прогнозування можна стверджувати, що майбутнє значення прогнозованого показника потрапить в інтервал, який дорівнює плюс або мінус два стандартних відхилення від знайденого прогнозного значення. Оцінку стандартної помилки прогнозу можна розрахувати, використовуючи формулу експоненційно зваженого середнього абсолютних значень помилок, за такою схемою: 1) розраховуємо помилку прогнозу як різницю між фактичним значенням і прогнозованим , тобто ; 2) розраховуємо середнє абсолютне відхилення (МАЕt): ; 3) для одержання оцінки стандартної помилки прогнозу помножимо значення середнього абсолютного відхилення (МАЕt) на 1,25 (за умов нормального закону розподілу): . Відповідні розрахунки проведені у стовпчиках (7) та (8) табл. 9, . Оскільки помилка прогнозу майже дорівнює прогнозному значенню показника, розрахунок інтервальних значень не дасть практичної користі для уточнення знайденого прогнозу. Таблиця 9 Період № періоду Бюджетні видатки ? = 0,3 ? = 0,7 ? = 0,5
Рис. 3. Реальні та прогнозовані значення видатків за методом експоненційного згладжування Висновки. Очікуване значення бюджетних видатків на економіку та підтримку зовнішньої торгівлі у IV кв. 1998 р. за методом експоненційного згладжування становить 5,67 % від ВВП. 5.3. Зразок виконання модульної лабораторної роботи № 2 МОДУЛЬНА ЛАБОРАТОРНА РОБОТА № 2 МАКРОЕКОНОМЕТРИЧНІ МОДЕЛІ ПРОГНОЗУВАННЯ Етапи виконання роботи 1. Постановка завдання прогнозування. 2. Специфікація моделі. 3. Оцінювання параметрів моделі. 4. Верифікація моделі. 5. Аналіз результатів моделювання. 6. Прогноз на основі побудованої моделі. Етап 1. Постановка завдання прогнозування Виходячи з сукупності спостережень за обсягом ВВП країни Y, зайнятістю в народному господарстві (чисельність працюючих) х1 і капіталу (основні фонди) х2 (табл. 1), необхідно побудувати економетричну модель виробничої функції і на основі одержаних результатів зробити економічний аналіз та прогноз її основних показників. Таблиця 1 Номер спостереження Обсяг ВВП, Y, млрд грн Чисельність працюючих, х1, млн чол Вартість основних фондів, х2, млрд грн
1 14 4 6
2 14 4 7
3 15 4,5 8
4 15,5 4,5 9
5 16 5 10
6 16 5,5 10,5
7 16,5 6 10,5
8 17 6 11
9 17,5 7 11,5
10 18,0 8 11
11 18,0 8,5 12
12 18,5 9 12,5
Етап 2. Специфікація моделі Припустимо, що виробнича функція визначається лінійною залежністю виду: , (1) де — кількість виробництва продукту, позначка ^ відповідає теоретичним (розрахованим за теоретичною моделлю) значенням змінних; х1, х2, …, хk — виробничі чинники; , , , …, — постійні величини, або параметри функції, позначка ^ відповідає теоретичним (розрахованим за теоретичною моделлю) значенням параметрів. Модель (1) встановлює теоретичну функцію залежності між Y та чинниками Xj, але статистичні спостереження за цими величинами ніколи не збігатимуться з функціональною залежністю. Тому необхідно замінити теоретичну функціональну модель ймовірнісною моделлю (2), формулювання якої називається специфікацією. , (2) де ui — залишки, стохастична величина відхилення i-го спостереження Y від теоретичного значення моделі (1); і — номер спостереження, i = 1, 2, ..., п. Специфікація моделі (2) включає функцію залежності Y від Xj, та закон розподілу ймовірностей величин ui. Етап 3. Оцінювання параметрів моделі Запишемо регресійну модель (2) в матричному вигляді: Y = XA + u, (3) де Y — вектор залежної змінної, розмірності (n · 1); X — матриця пояснюючих змінних, розмірності (n · (k + 1)); A — вектор невідомих параметрів моделі ((k + 1) · 1); u — вектор випадкових залишків розмірності (n · 1). За даними табл. 1 запишемо матриці ; ; ; . Теоретична модель має вигляд , (4) де , — оцінки залежної змінної та параметрів моделі. Отже, залишки дорівнюють . (5) Чим менше відхилення (5), тим краще економетрична модель (3) відповідає теоретичній моделі (4). Метод найменших квадратів (МНК) — обчислювальний спосіб, який забезпечує мінімізацію суми квадратів залишків при фіксованій множині даних . (6) МНК — оцінка вектора А є вектор (, який при підстановці в (6) мінімізує uТu незалежно від характеру розподілу залишків. Цю оцінку можна знайти, якщо похідну функції (6) по ( прирівняти до нульового вектора. Звідси одержимо систему нормальних рівнянь: (XTX)( = XTY (7) та ( = (XТX)–1XТY. (8) Розрахуємо оцінки параметрів моделі (4) за формулою (8). . Запишемо виробничу функцію, тобто розраховану теоретичну модель: = 9,814 + 0,4318x1 + 0,3961x2 . (9) Етап 4. Верифікація моделі Верифікація моделі — це визначення якості пристосування моделі до вибіркових даних спостережень. Для з’ясування правильності побудованої моделі треба зробити три важливих перевірки: насамперед перевіряється відповідність одержаних результатів економічним властивостям зв’язку між змінними, які були сформульовані на першому етапі; друга перевірка відповідає верифікації моделі, для чого звертаються до деяких припущень щодо поведінки залишків, які дозволяють застосувати статистичні критерії перевірки значущості оцінених параметрів та моделі в цілому; останніми робляться перевірки всіх прийнятих попередніх припущень відносно залишків ui , щоб встановити міру їх реалістичності. Якщо припущення виявляються неправдоподібними, то довірчі інтервали та точкові значення оцінок не повинні сприйматися всерйоз і використовуватися для економічного аналізу. Зупинимося на розгляді другої перевірки, оскільки про першу перевірку мова піде в економічному аналізі результату моделювання, а третя перевірка розглядається в наступних завданнях. Перевірка статистичної значущості рівняння регресії Мірою середнього розсіювання спостережень навкруги теоретичної моделі є оцінка дисперсії залишків ; (10) де n — кількість спостережень; k — кількість пояснюючих змінних. Можна звернутися до одного з трьох еквівалентних методів перевірки: 1) до таблиці аналізу дисперсії; 2) до розрахунку коефіцієнта кореляції між Y та ; 3) до визначення стандартної похибки оцінки залишків, (u. Зупинимося на характеристиці дисперсійного аналізу. Припускаючи, що залишки нормально розподілені, можна перевірити адекватність моделі реальному процесу за допомогою статистик R2, R та F (коефіцієнтів детермінації, множинної кореляції, критерію Фішера), розрахунок яких узагальнюється в таблиці дисперсійного аналізу (табл. 2) залежної змінної Y. Таблиця 2 Компоненти дисперсії Сума квадратів відхилень Ступені свободи Середній квадрат (дисперсія)
Регресія
k
Залишки
n – k – 1
Загальна дисперсія
n – 1
Частка загальної дисперсії Y, яка пояснюється регресією Y по X1, X2, …, Xk, вимірюється коефіцієнтом детермінації: . (11) Тісноту лінійного зв’язку Y з пояснюючими змінними характеризує коефіцієнт множинної кореляції . (12) Значущість коефіцієнта кореляції і моделі (4) в цілому можна перевірити за допомогою F-cтатистики: (13) або , (14) критичне значення F знаходять за статистичними таблицями F-розподілу (критерію Фішера), для обраного рівня значущості ( (( = 0,01, ( = 0,05 або 1 % та 5 % імовірності похибки) та ступенях свободи k та (n – k – 1). Фактичне значення F порівнюється з табличним. Якщо Fфакт > Fтабл, то можна стверджувати, що коефіцієнт кореляції значущий, а економетрична модель (3) достовірна, тобто нульова гіпотеза про неіснування впливу пояснюючих змінних X на залежну змінну Y повинна бути відхилена з імовірністю 95 %. Зробимо відповідні розрахунки для побудованої моделі. (Зазначимо, що розрахунки наведених нижче статистик можна отримати за допомогою функції ЛІНІЙНА програми EXCEL.) Визначимо коефіцієнт детермінації за формулою (11): ; ;
, . Отже, варіація випуску продукції Y майже на 97 % пояснюється варіацією трудових ресурсів х1 і виробничих фондів х2. Цей зв’язок досить сильний, оскільки коефіцієнт множинної кореляції R = 0,99. Перевіримо значущість побудованої моделі за допомогоюF-статистики: . . Тобто F > Fтабл, що говорить про значущість моделі. Перевірка статистичної значущості окремих коефіцієнтів регресії Достовірність економетричної моделі досягається також за рахунок значущості її окремих параметрів. Для перевірки значущості коефіцієнтів регресії а0, а1, а2 … аn використовують критерій Стьюдента, або t-критерій. Відношення оцінки параметра aj до стандартної похибки його оцінки має t-розподіл, тобто . (15) Одержане за (15) значення t порівнюється з табличним при вибраному рівні довіри (() і заданих ступенях свободи (n – k – 1). Якщо фактичне значення більше табличного, то відповідний параметр моделі є значущим, тобто нульова гіпотеза про aj = 0 відхиляється з імовірністю (1 – ()100 %. Дисперсії (діагональні елементи) та коваріації (позадіагональні елементи) оцінок параметрів аj дає коваріаційна матриця : , або , (16) де А — вектор справжніх значень параметрів у регресії. Дисперсії оцінок параметрів моделі дорівнюють: , (17) де djj — j-й діагональний елемент матриці похибок (ХTХ)–1. Враховуючи (17), t-статистику для j-го параметра моделі можна розрахувати так: . (18) Розрахуємо спочатку : ; (19) YTY = 3227; ATXTY = 3226,44; YТY – AТXТY = 3227 – 3226,44 = 0,56. Дисперсія залишків дорівнює: . Тоді матриця коваріацій оцінок параметрів моделі буде дорівнювати: . Визначимо дисперсії оцінок параметрів регресії. У нашому прикладі це діагональні елементи матриці . Отже, дисперсії і середньоквадратичні відхилення (стандартні помилки) оцінок параметрів моделі дорівнюють: , ; , ; , . Одержані середньоквадратичні відхилення використовуються для визначення довірчих інтервалів параметрів і для перевірки їх значущості. Перевіримо значущість оцінок , параметрів економетричної моделі: . Знайдемо разрахункове значення t-критерію: ; ; ; . Усі розраховані t-статистики більше критичного значення, яке знаходимо в таблицях t-розподілу (). Отже, параметри статистично значущі з імовірністю 95 %. Формулу (18) можна використовувати безпосередньо (без аналізу дисперсії) для статистичної перевірки нульової гіпотези відносно параметрів аj. Розрахунок довірчого інтервалу для аj виконується за формулою (20): , (20) де — точкова оцінка параметра aj, одержана за 1МНК; t(, n – k – 1 — табличне значення t-критерію для рівня значущості ( та (n – k – 1) ступенів свободи. Якщо aj несуттєво відрізняється від нуля, то довірчий інтервал включає нульове значення aj. Довірчі інтервали параметрів моделі дорівнюють: , 0,23 ( а1 ( 0,64; ,0,22 ( a2 ( 0,57. Ці ж результати можна одержати за допомогою функції ЛІНІЙНА програми EXCEL. Етап 5. Аналіз результатів моделювання Якщо верифікація моделі підтвердила її значущість, можна перейти до економічного тлумачення одержаних результатів. Виокремимо такі характеристики для проведення економічного аналізу: середня ефективність чинника: ; (21) гранична ефективність чинника: (j = (y / (xj = aj ; (22) еластичність функції за чинником: ; (23) міра ефективності використання ресурсів ; (24) гранична норма заміщення k-го чинника на r-й чинник: ; (25) сумарна еластичність . (26) Розрахуємо дані показники для виробничої функції: . Усі показники розрахуємо через середні значення змінних. Оскільки , то середня величина випуску продукції за моделлю: млрд грн, а також середня величина трудових ресурсів і виробничих фондів має значення млрд грн, млрд грн. Тоді для чинника х1 середня продуктивність трудових ресурсів , тобто середня продуктивність праці (за умови, що х2 — const) дорівнює 2,73 грн/люд.-год. Гранична продуктивність праці має значення: 0,23 (( 0,64, тобто на одну трудову одиницю припадає від 0,23 до 0,64 млрд грн продукції (за незмінного обсягу виробничих фондів). Еластичність випуску продукції по трудових ресурсах визначимо як: , тобто на 0,15 % збільшиться випуск продукції, якщо трудові ресурси зростуть на 1 %. Міра ефективності використання трудових ресурсів: , отже граничний приріст випуску продукції на одиницю трудових ресурсів дорівнює 0,07 одиниць, тобто досить незначний. Обчислимо ті самі показники для чинника х2 — виробничих фондів. Середня фондовіддача: , тобто на одиницю виробничих фондів припадає (у середньому) 1,66 одиниці продукції (за фіксованого значення (х1) трудових ресурсів) Граничний показник фондовіддачі має значення: , тобто на одиницю виробничих фондів припадає 0,4 грн продукції (за незмінного обсягу трудових ресурсів). Еластичність випуску продукції по виробничих фондах визначається так: , тобто на 0,24 % збільшиться випуск продукції, якщо виробничі фонди збільшаться на 1 %. Міра ефективності використання виробничих фондів: , тобто граничний приріст випуску продукції на одиницю виробничих фондів дорівнює 0,04 одиниці. Визначимо показники, які стосуються обох чинників. Гранична норма заміщення першого чинника другим: , тобто цей показних характеризує те, що трудові ресурси і виробничі фонди при сталому значенні випуску продукції можуть бути взаємно заміщеними. У нашому прикладі зменшення трудових ресурсів на одиницю за незмінного випуску продукції передбачає підвищення обсягу виробничих фондів на 1,07 одиниці. Загальна еластичність випуску продукції обох чинників дорівнює Е1 + Е2 = 0,15 + 0,239 = 0,389. Оскільки сумарна еластичність менше 1, обсяг виробництва змінюється відносно зміни чинників виробництва в меншій пропорції. Порівняти вплив трудових ресурсів та виробничих фондів на випуск продукції можна використовуючи стандартизовані коефіцієнти (. (-коефіцієнти показують, на скільки одиниць своїх стандартних помилок змінюється залежна змінна Y, якщо певний j-й фактор змінюється на одну свою стандартну похибку Розрахунки ведуться за такими формулами: , . (27) Y
14 13,92 –2,333 5,444 –2 –3,917
14 14,41 –2,333 5,444 –2 –2,917
15 14,93 –1,333 1,778 –1,5 –1,917
15,5 15,32 –0,833 0,694 –1,5 –0,917
16 15,93 –0,333 0,111 –1 0,083
16 16,35 –0,333 0,111 –0,5 0,583
16,5 16,56 0,167 0,028 0 0,583
17 16,76 0,667 0,444 0 1,083
17,5 17,39 1,167 1,361 1 1,583
18 17,63 1,667 2,778 2 1,083
18 18,24 1,667 2,778 2,5 2,083
18,5 18,65 2,167 4,694 3 2,583
; , , ; , . (-коефіцієнти визначаються за формулою: . (28) ;. Таким чином, вплив змінної Х2 (виробничих фондів) на змінну Y (випуск продукції) в 1,054 раза перевищує вплив Х1. Етап 6. Прогноз на основі побудованої моделі Перевірка прогнозних властивостей моделі передбачає встановлення різниці між передбачуваним значенням і фактичним значенням при значеннях пояснюючих змінних у майбутньому періоді. Обчислення прогнозу можна зробити на основі регресії . Нехай є оцінкою дійсного значення у0 генеральної сукупності. Тоді з певною ймовірністю для нормального закону розподілу оцінки потрібно знайти такий інтервал, в якому буде перебувати значення у0 генеральної сукупності, тобто , (29) де — стандартна помилка математичного сподівання прогнозу; X0 — прогнозні значення екзогенних змінних.
Для прогнозних значень Х0 = (1; 12; 12) оцінка регресії . Знайдемо довірчий інтервал для 1 – ( = 0,95 або ( = 0,05; ступенях свободи n – k – 1 = 9. Показник . Тоді , або 19,715 – 2,269 · 0,4 ( y0 ( 19,715 + 2,269 · 0,4;18,81 ( y0 ( 20,62. Цей результат означає, що з імовірністю 95 % середнє значення випуску продукції слід чекати в інтервалі від 18,81 до 20,62 млрд грн при х1 = 12 млрд люд./год. та х2 = 12 млрд грн. Дисперсія прогнозного індивідуального значення: . (30) Знайдемо = 0,062 + 0,164 = 0,226. Звідси = 0,48. Тоді довірчий інтервал для індивідуального прогнозного значення буде 19,715 – 2,269 – 0,48 ( у0(i) ( 19,715 + 2,269 · 0,48; 18,62 ( у0(i) ( 20,80. Це означає, що при затратах чинників виробництва х1 = 12 та х2 = 12 слід чекати обсяг виробництва продукції в інтервалі 18,62 ( 20,8 млрд грн з імовірністю 95 %.
Рис. 1. Зміна дисперсії прогнозу Другий член у формулі (30) залежить від значень X0, тобто прогнозних значень пояснюючих змінних. Він дорівнює нулю, якщо X0 дорівнює середньому значенню Xj вибірки і тим більше, чим більше X0 відрізняється від середнього (рис. 1). Похибка прогнозу при t = 2 (що відповідає майже 95 % рівню довіри) дорівнює 2?0р і може характеризувати «якість» побудованої моделі. Якщо порядок похибки прогнозу несуттєво відрізняється від порядку середнього значення Y, то незважаючи на можливо високе значення коефіцієнта R2, прогнозні якості такої моделі погані.