Прогнозування тенденції на основі згладжування часових рядів Задача згладжування часового ряду має таке формулювання. Для реалізації (часового ряду) () деякого випадкового процесу потрібно найкращим чином визначити оцінку деякої невипадкової компоненти (тренду) , яка в кожен фіксований момент часу є середнім значенням випадкової величини і відображає основні закономірності зміни досліджуваного показника в часі. 3.1. Прогнозування тенденції часового ряду за середніми характеристиками Найпростішим способом прогнозування вважається підхід, який визначає прогнозову оцінку від фактично досягнутого рівня за допомогою середнього рівня, середнього приросту, середнього темпу зростання. Екстраполяція на основі середнього рівня ряду. Під час екстраполяції соціально-економічних процесів на основі середнього рівня ряду прогнозоване значення беруть як середнє арифметичне значення попередніх рівнів ряду, тобто точковий прогноз , зроблений у момент часу на період упередження , розраховують за формулою: . (3.1.1) Інтервал надійності для прогнозу середньої за невеликої кількості спостережень визначається як , (3.1.2) де — критичне значення — критерію Стьюдента із ступенями свободи й рівнем значущості ; — оцінка середньої квадратичної похибки середнього (, де — оцінка середньоквадратичного відхилення спостережень). Отриманий інтервал надійності враховує невизначеність, приховану в оцінці середньої величини. Однак залишається припущення, що прогнозований показник дорівнює середньому вибірковому значенню, тобто за такого підходу не зважають на те, що окремі значення показника коливалися навкруги середнього в минулому, і це також відбуватиметься в майбутньому. Отже, загальна дисперсія включає коливання вибіркової середньої та коливання індивідуальних значень навколо середнього і становить величину , а інтервал надійності для прогнозованої оцінки ряду дорівнює: . (3.1.3) Екстраполяцію за середнім абсолютним приростом можна бути виконати в тому разі, коли загальна тенденція розвитку вважається лінійною. Прогнозову оцінку одержують за формулою: , (3.1.4) де — середній абсолютний приріст. Екстраполяцію за середнім темпом зростання можна виконувати у разі, коли є підстави вважати, що загальна тенденція динамічного ряду характеризується експоненціальною кривою. Прогноз , зроблений у момент часу на період випередження , у цьому разі розраховують за формулою: , (3.1.5) де — середній темп зростання, розрахований за середньою геометричною (1.1.8). Інтервал надійності прогнозу за середнім абсолютним приростом і середнім темпом зростання можна одержати лише тоді, коли ці середні визначаються за допомогою статистичного оцінювання параметрів відповідно лінійної та експоненціальної кривої (див. 3.2). Усі три способи привертають увагу багатьох працівників статистичних органів завдяки своїй простоті та легкості реалізації. Однак, крім зазначених позитивних якостей, вони мають кілька суттєвих недоліків. По-перше, всі фактичні спостереження є результатом закономірності та випадковості, отже, виходити тільки з останнього спостереження неправильно. По-друге, немає можливості оцінити слушність використання середньої характеристики ряду в кожному конкретному випадку. По-третє, не завжди можна розрахувати інтервал надійності, до якого потрапляє прогнозована величина, і визначити його ймовірність. У зв’язку із цим екстраполяцію за середніми характеристиками ряду застосовують лише як орієнтир майбутнього розвитку або якщо неможливо використати інші статистичні методи (наприклад, за дуже малої кількості спостережень). 3.2. Прогнозування тенденції часового ряду за аналітичними методами згладжування До методів аналітичного згладжування відносять регресійний аналіз разом із методом найменших квадратів та його модифікаціями. Виявити основну тенденцію аналітичним методом — означає надати досліджуваному процесу однакового розвитку впродовж усього часу спостереження. Тому для цих методів важливо обрати оптимальну функцію детермінованого тренду (кривої зростання), яка згладжує ряд спостережень . Регресійний аналіз. Оцінювання параметрів кривих зростання здійснюють на підставі побудови моделі регресії, в якій пояснювальною змінною є час: (3.2.1) де — функція тренду (крива зростання); — невідомі випадкові похибки. Виходячи з теоретичних міркувань крива зростання може описуватися будь-якою математичною функцією . Оцінювання цієї функціональної залежності здійснюють за вибірковими спостереженнями , , а вибір методу оцінювання залежить від виду кривої й стохастичного походження випадкових похибок . Якщо функція лінійна за параметрами, наприклад, має вигляд алгебраїчного полінома ступеня p: , (3.2.2) і при цьому довжина часового ряду суттєво перевищує ступінь полінома , а випадкові залишки мають властивості «білого шуму», тобто , (3.2.3) тоді оцінки параметрів можна одержати методом найменших квадратів (МНК). МНК-оцінки параметрів лінійної регресії за умови мінімізації суми квадратів відхилень точок вхідного часового ряду від їхніх згладжених значень : (3.2.4) обчислюють за формулою: , (3.2.5) де — вектор оцінок параметрів моделі; — матриця значень спостережень пояснювальних змінних розмірністю , яка у разі (3.2.2) має вигляд , — вектор-стовпчик спостережень залежної змінної . Побудована модель прогнозу має супроводжуватися додатковою інформацією стосовно її точності та адекватності. Якщо умова сталості дисперсії та взаємної незалежності випадкових похибок моделі (3.2.3) не виконується, застосовують узагальнений МНК; модель, у якій функція є нелінійною за параметрами, потребує техніки статистичного аналізу нелінійних моделей регресії тощо. Для розрахунку в момент часу прогнозової оцінки на період випередження потрібно оцінити параметри лінійного тренду та підставити їх у рівняння тренду (наприклад, (3.2.2)), де . Методи, розроблені для статистичних сукупностей, уможливлюють визначення інтервалу надійності прогнозу, який залежить від стандартної похибки оцінки прогнозованого показника, від часу випередження прогнозу, від довжини прогнозової бази та обраного рівня значущості. Наприклад, у разі прямолінійного тренду інтервал надійності прогнозу має вигляд , (3.2.6) де — період випередження; — точковий прогноз на момент часу ; п — кількість спостережень у часовому ряду (довжина прогнозової бази); — оцінка стандартної похибки (середньоквадратичною відхилення) оцінки , ; — табличне значення критерію Стьюдента для рівня значущості ? і числа ступенів свободи . Іноді для розрахунку інтервалів надійності прогнозу відносно лінійного тренду застосовують наведену вище формулу в дещо перетвореному вигляді: , або , (3.2.7) якщо перенести початок відліку часу на середину періоду спостережень (), де t — порядковий номер рівня ряду (t = 1, 2,..., п); — час, для якого здійснюють прогноз; — час, що відповідає середині періоду спостережень вхідного ряду; підсумок робиться за всіма спостереженнями. Формула для розрахунку інтервалів надійності прогнозу відносно тренду, який має вид полінома другого або третього порядку, виглядає так: . (3.2.8) Аналогічно розраховують інтервали надійності для кривих зростання, які можна звести до лінійної функції. Розглянутий розрахунок інтервалів надійності прогнозів на підставі кривих зростання, що ґрунтується на висновках і формулах теорії регресійного аналізу, для часових рядів не зовсім правомірний, оскільки динамічні ряди, як уже зазначалося, відріз-няються від статистичних сукупностей. Тому до оцінювання інтервалів надійності для кривих зростання слід підходити з певною обережністю. Якщо припустити, що випадкова змінна () є стаціонарним часовим рядом, то похибка прогнозу становитиме . (3.2.9) Звідси . (3.2.10) Динамічним мультиплікатором збурення , тобто величиною, яка показує, на скільки зміниться значення часового ряду через періодів залежно від поточного збурення, є . Очевидно, що вплив збурення буде спадати з часом, тому . Методи прогнозування, ґрунтовані на методах регресії, використовують для короткотермінового та середньострокового прогнозування. Вони не допускають адаптації: з отриманням нових даних процедура побудови прогнозу має повторюватися спочатку. Оптимальна довжина періоду випередження визначається окремо для кожного економічного процесу з урахуванням його статистичної нестабільності. Ця довжина, як правило, не перевищує для рядів річних спостережень третини обсягу даних, а для квартальних і місячних рядів — двох років. Види кривих зростання. Для відображення економічних процесів існує велика кількість видів кривих зростання. Щоб правильно підібрати найдоцільнішу криву для моделювання й прогнозування економічного явища, необхідно знати особливості кожного виду кривих. Криві зростання описують різні тенденції економічних процесів, наприклад, життєвий цикл товару, процес нагромадження капіталу, маркетингові зусилля фірм тощо. В економічній практиці вже здобуто певний досвід і розроблено певні типи кривих, які найчастіше використовують у соціально-економічних дослідженнях. До таких кривих належать: поліноміальні, експоненціальні та S-подібні криві зростання. Поліноміальні криві зростання можна використовувати для апроксимації (наближення) та прогнозування економічних процесів, у яких майбутній розвиток не залежить від досягнутого рівня. Простіші поліноміальні криві зростання мають вигляд: (поліном першого ступеня), (поліном другого ступеня), (3.2.11) (поліном третього ступеня) тощо. Поліноміальні моделі лінійні за параметрами. Параметри цих моделей (лінійної, квадратичної, полінома третього ступеня) мають такі економічні тлумачення: а1 — лінійний приріст, а2 — прискорення зростання, а3 — характеризує динаміку прискорення зростання. Для полінома першого ступеня характерний постійний приріст. Якщо обчислити перші прирости за формулою , t = 2, 3, ..., n, то вони будуть постійними величинами та дорівнюватимуть а1. Якщо перші прирости обчислити для полінома другого ступеня, то вони матимуть лінійну залежність від часу і ряд із перших приростів на графіку буде представлений прямою лінією. Другі прирости для полінома другого ступеня будуть постійними. Для полінома третього ступеня перші прирости будуть поліномами другого ступеня, другі прирости будуть лінійною функцією часу, а треті прирости, які обчислюють за формулою , будуть постійними величинами. Звідси можна відзначити такі властивості поліноміальних кривих зростання: від полінома високого ступеня шляхом розрахунку послідовних різниць (приростів) можна перейти до полінома нижчого порядку; значення приростів для поліномів будь-якого порядку є сталими величинами. Експоненціальні криві використовують для зображення швидко зростаючих або спадних економічних процесів. Використання експоненціальних кривих зростання передбачає, що майбутній розвиток залежить від досягнутого рівня, тобто приріст залежить від значення функції. В економіці використовують два різновиди експоненціальних кривих: просту експоненту та модифіковану експоненти. Проста експонента може набувати різноманітних еквівалентних форм. , основна форма . (3.2.12) , b замінюємо на , де . (3.2.13) , b замінюємо на (1-r), де . (3.2.14) , де a замінюємо на , i b на . (3.2.15) , де a замінюємо на , i b на , (3.2.16) де а й b — додатні числа, при цьому якщо , то функція зростає, якщо — спадає. Усі ці форми використовують на практиці для описання різних економічних процесів, наприклад, форму (3.2.14) найчастіше використовують у фінансах, де r означає норму річного відсотка. Логарифми ординат простої експоненти лінійно залежать від часу. Наприклад, для функції (3.2.12) , тобто темп зростання постійний для будь-якого моменту часу. Якщо ця крива застосовується для зображення інфляції, то коефіцієнт b буде характеризувати темп інфляції. Можна помітити, що ордината цієї функції змінюється з постійним темпом приросту. Якщо взяти відношення приросту до самої ординати, то воно буде сталою величиною: . Модифікована експонента має вигляд: , (3.2.17) де постійні величини: , , а константа має назву асимптоти цієї функції, тобто значення функції необмежено наближаються (знизу) до величини . Можуть бути й інші варіанти модифікованої експоненти, але на практиці найчастіше трапляється розглянута вище функція. Наприклад, якщо на ринку з’являється новий товар, який супроводжується широкою рекламою, то спочатку попит на цей товар буде досить великий і швидкість продажу товару буде значною. Із часом продаж буде стабілізуватися та дійде до певного рівня насичення. У таких випадках фаза уповільненого зростання відсутня, і найкраще згладжування дасть модифікована експонента. Логарифми перших приростів цієї функції лінійно залежать від часу, а якщо взяти відношення двох послідовних приростів, то воно буде сталою величиною: . Модифікована експонента слугує базовою кривою, на підставі якої за допомогою певних перетворень отримують криву Гомперця (3.2.23) і логістичну криву (3.2.24), які використовують частіше. Степенева крива. Рівняння степеневої кривої має вигляд: . (3.2.18) Степенева крива добре згладжує показники, які з часом монотонно зростають, якщо , або спадають, якщо . Зокрема, за , . Це рівняння задає гіперболу, асимптотами якої є вісі координат, а добуток змінних є сталою величиною (). В економіці такій умові задовольняє крива попиту з одиничною еластичністю: відсоток збільшення одиниці часу t на такий самий відсоток зменшує залежну змінну . На практиці степеневі функції використовують для зображення різноманітних економічних процесів. Найвідомішою з них є виробнича функція Кобба-Дугласа. Крім того, вони застосовуються для зображення кривих байдужості, а також попиту на товари різних категорій (так звана крива Торнквіста) тощо. Гіперболічна крива І типу. Звичайна гіпербола задається рівнянням: . (3.2.19) Для цього типу гіперболи за значення зменшується мірою зростання t і асимптотично наближається до а. Такого виду криву можна застосовувати для вирівнювання й прогнозування показника, який із часом спадає до певного відмінного від нуля рівня. За значення додатне, тільки якщо ; збільшення t приводить у цьому випадку і до збільшення з асимптотичною межею, що дорівнює а. Таким типом гіперболи доцільно зображувати зростаючі процеси з насиченням. Гіперболічна крива II типу. Цей тип гіперболи задається рівнянням (3.2.20) За значення прагнуть до нуля у разі необмеженого збільшення часу t; за значення прагне до нескінченності, якщо t наближається до a/b. Остання ситуація на практиці мало ймовірна. Гіперболічна крива IIІ типу (проста раціональна залежність). Задається рівнянням . (3.2.21) Для цього типу гіперболи незалежно від коефіцієнта b за . Для додатних значень b значення зростає та асимптотично прагне до величини 1/b за необмеженого збільшення t. За від’ємного b ця крива, як і гіпербола другого типу, стає нестійкою за t = a/b. S-подібна крива. В економіці поширені процеси, які спочатку поступово зростають, прискорюються, а потім знов уповільнюють свій розвиток, прагнучи певної межі. Наприклад, процес введення промислового об’єкта до експлуатації або зміна попиту на товари, що мають межу насичення тощо. Для моделювання таких процесів використовують так звані S-подібні криві зростання, які мають вигляд: (3.2.22) Насправді ця крива має форму S тільки за від’ємного значення b та за умов, що його абсолютне значення більше за а. Якщо крива (3.2.22) справді має форму S, вона використовується для зображення повного циклу розвитку динамічних процесів. Повний цикл таких процесів починається з повільного зростання, потім настає фаза бурхливого розвитку і, нарешті, розвиток завершується періодом насичення (тобто асимптотичного наближення до величини ). Таке чергування фаз властиве багатьом соціально-економічним процесам. Для S-подібної кривої точку перегину, в якій швидкість зростання досягає максимального значення, знаходять розв’язок рівняння , де — друга похідна за t кривою f(t). Для S-подібної кривої точкою перегину, тобто точкою, в якій зростання коефіцієнта нахилу дотичної змінюється спадом, буде точка . Утім, на практиці для опису таких процесів замість S-подібної кривої використовують більш гнучкі й адекватні криві: Гомперця та логістичну. Крива Гомперця має такий аналітичний вираз: , (3.2.23) де с, b — додатні параметри, причому ; параметр а — асимптота функції. У кривій Гомперця виокремлюють чотири ділянки: на першій приріст функції незначний, на другій — збільшується, на третій ділянці приріст майже постійний, на четвертій — відбувається вповільнення темпів приросту, і функція необмежено наближається до значення а. В результаті конфігурація кривої нагадує латинську літеру S. Точкою перегину цієї кривої буде зі значенням функції , яке дорівнює , де е = 2,71828. Логарифм цієї функції () є модифікованою експонентою; логарифм відношення першого приросту до самої ординати функції лінійною функцією часу. На підставі кривої Гомперця будується, наприклад, динаміка показників рівня життя; модифікації цієї кривої використовують у демографії для моделювання показника смертності тощо. Логістична крива, або крива Перла-Ріда — зростаюча функція, яку найчастіше записують у вигляді . (3.2.24) У цьому виразі і — додатні параметри; — граничне значення функції за нескінченного зростання часу. Якщо взяти похідну від цієї функції, можна побачити, що швидкість зростання логістичної кривої у будь-який момент часу пропорційна досягнутому рівню функції й різниці між граничним значенням і досягнутим рівнем. Логарифм відношення першого приросту функції до квадрата її значення (ординати) є лінійною функцією від часу. Конфігурація графіка логістичної кривої близька до графіка кривої Гомперця, але, на відміну від останнього, логістична крива має точку симетрії, яка збігається із точкою перегину. Точка перегину дорівнює . Значення у точці перегину дорівнює . Метод найменших квадратів і процедури регресійного аналізу є доцільними для випадку, коли рівняння кривої зростання після деяких перетворень можна звести до лінійної регресії. У таблиці 3.2.1. наведено криві зростання, які найчастіше спостерігаються в соціально-економічних дослідженнях, їхні математичні функції та перетворення, необхідні для зведення функцій до лінійного вигляду. Таблиця 3.2.1 ВИДИ КРИВИХ ЗРОСТАННЯ Основні види кривих зростання Математична функція Лінеаризація функції
1 2 3
Лінійна (поліном першого ступеня)
Не потрібна
Квадратична (поліном другого ступеня)
Поліном третього ступеня
Експонента (проста)
Логарифмічна крива
S-подібна крива
Обернена логарифмічна крива
Степенева
Гіперболічна крива І типу
Гіперболічна крива ІІ типу
,
Гіперболічна крива ІІІ типу
Закінчення табл. 3.2.1 1 2 3
Модифікована експонента
; ;
Крива Гомперця
Логістична крива
,
Як видно з таблиці 3.2.1, у практиці криволінійного вирівнювання широко використовують два види перетворень: логарифмування () і зворотне перетворення . При цьому можливі перетворення як залежної змінної , так і незалежної t або обох одночасно. Параметри S-подібних кривих (Гомперця та логістичної кривої) визначаються складнішим способом. Їх можна отримати із модифікованої експоненти, так само, як були отримані зі звичайної лінійної регресії криві, розглянуті раніше. Криві, побудовані за модифікованою експонентою, задаються трьома параметрами (замість двох параметрів у лінійній залежності). Спочатку визначають параметр с, а потім два інші параметри: а та b. У табл. 3.2.1 наведено відповідні перетворення функції Гомперця та логістичної кривої на модифіковану експоненту. Апроксимація спостережень складними функціями дає задовільне наближення до фактичних спостережень, але зменшує сталість моделі на інтервалі упередження прогнозу. Тому використовувати для прогнозування такі моделі (наприклад, поліном вище другого ступеня) слід обережно. В комп’ютерних програмах використовують близько двох десятків моделей. Зазначимо, що пошук параметрів функції Гомперця та логістичної кривої, через неможливість їхньої лінеаризації здійснюють методом багатовимірної числової оптимізації. Вибір кривої зростання. Правильно встановити вид кривої, тобто вид аналітичної залежності значення показника від часу — одне з найважчих завдань. Обрана функція тренду має задовольняти такі умови: бути теоретично обґрунтованою; мати якнайменшу кількість параметрів; параметри функції повинні мати економічне тлумачення; оцінені значення тренду мають якомога менше відрізнятися від відповідних фактичних спостережень часового ряду. Вибір форми кривої для згладжування певною мірою залежить від мети згладжування: інтерполяції або екстраполяції. У першому випадку метою є досягнення найбільшої близькості до фактичних рівнів часового ряду. У другому — виявлення основної закономірності розвитку явища, стосовно якої можна припустити, що в майбутньому вона збережеться. В основі вибору кривої лежить теоретичний аналіз сутності економічного явища, зміни якого відображаються часовим рядом. Іноді до уваги беруть міркування стосовно характеру зростання рівнів ряду. Так, якщо зростання випуску продукції передбачається у вигляді арифметичної прогресії, то згладжування відбувається за прямою; якщо зростання йде в геометричній прогресії, то згладжування виконують за показниковою функцією. На практиці під час попереднього аналізу часового ряду обирають, як правило, дві-три криві зростання для подальшого дослідження і побудови трендової моделі часового ряду. Розглянемо проблему вибору виду кривої зростання для конкретного часового ряду. Метод послідовних різниць (Тінтнера). Цей метод може бути використаний для визначення порядку (ступеня) апроксимаційного полінома, якщо, по-перше, рівні часового ряду складаються лише із двох компонент: тренду та випадкової, і, по-друге, тренд є досить гладеньким, щоб його можна було згладити поліномом певного ступеня. Алгоритм застосування методу ідентичний алгоритму визначення порядку інтеграції нестаціонарного процесу (див. 2.6) і передбачає такі кроки. 1. Розраховують різниці (прирости) до d-гo порядку включно: ; ; (3.2.25) . . . . . . . . . . . Для апроксимації економічних процесів зазвичай розраховують різниці до четвертого порядку. 2. Для вхідного ряду та для кожного різницевого ряду обчислюють дисперсії за такими формулами: для вхідного ряду — ; (3.2.26) для різницевого ряду d-го порядку (d = 1, 2, ...) — , (3.2.27) де — біноміальний коефіцієнт. 3. Порівнюють значення кожної наступної дисперсії із попередньою, тобто розраховують різниці , і якщо для будь-якого k ця величина не перевищує певної наперед заданої додатної величини, тобто порядок величин дисперсій однаковий, то ступінь апроксимаційного полінома має дорівнювати d – 1. Необхідно зазначити, що для визначення тренду в економічних часових рядах не слід використовувати поліноми дуже великого порядку, оскільки отримані в такий спосіб функції згладжування відображатимуть випадкові відхилення, а не детерміновану складову, що суперечить поняттю тенденції. Метод характеристик приросту є універсальним методом попереднього вибору кривих зростання. Він ґрунтується на використанні окремих характерних властивостей кривих, розглянутих вище. За цього методу вхідний часовий ряд попередньо згладжують методом простої змінної середньої. Наприклад, для інтервалу згладжування т = 3 згладжені рівні розраховують за формулою: , (3.2.28) причому щоб не втратити перший та останній рівні, їх згладжують за формулами: , . (3.2.29) Далі обчислюють перші середні прирости , t = 2, 3,…l, n – 1; (3.2.30) другі середні прирости , (3.2.31) а також ряд похідних величин: ; ; ; . (3.2.32) Відповідно до характеру зміни середніх приростів і похідних показників обирають вид кривої зростання для вхідного часового ряду [27], при цьому використовують відомості з табл. 3.2.2. Таблиця 3.2.2. ВИБІР КРИВОЇ ЗРОСТАННЯ ЗА ХАРАКТЕРОМ ЗМІНИ ПОКАЗНИКА Показник Характер зміни показника з часом Вид кривої зростання
Перший середній приріст Майже однаковий Поліном першого порядку (пряма)
Змінюється лінійно Поліном другого порядку (парабола)
Другий середній приріст Змінюється лінійно Поліном третього порядку (кубічна парабола)