Лабораторная работа № 4. РЯДЫ ДИНАМИКИ. ОПРЕДЕЛЕНИЕ ОСНОВНОЙ ТЕНДЕНЦИИ РАЗВИТИЯ.
Цель работы: Изучение тенденции развития и установление закономерностей изменения уровней изучаемых показателей динамических рядов во времени.
Задание. Используя данные о дневном выпуске продукции предприятия за месяц (см. табл. выровнять динамический ряд методами:
укрупнения интервала динамического ряда,
скользящей средней,
прямой линии,
параболы,
показательной кривой,
адаптивного моделирования и прогнозирования.
Представить выровненные и сглаженные динамические ряды графически.
Условие. На примере о выпуске продукции предприятием в течение рабочих дней месяца, проанализировать какой из методов наиболее адекватно описывает эмпирический динамический ряд представленных показателей (табл. 1).
Таблица 1
Выполнение задания.
Определение основной тенденции развития (тренда) называется в статистике выравниванием временного ряда, а методы выявления основной тенденции – методами выравнивания. Выравнивание позволяет охарактеризовать особенность изменения во времени данного динамического ряда в наиболее общем виде как функцию времени. Одним из наиболее известных приемов обнаружения общей тенденции развития является укрупнение интервала динамического ряда.
Укрупнение интервала динамического ряда.
Смысл приема заключается в том, что первоначальный ряд динамики преобразуется и заменяется другим, показатели которого относятся к большим по продолжительности периодам времени. Например, ряд, содержащий данные о месячном выпуске продукции, может быть преобразован в ряд квартальных данных. При суммировании уровней или при выведении средних по укрупненным интервалам отклонения в уровнях, обусловленные случайными причинами, взаимопогашаются, сглаживаются и более четко обнаруживается действие основных факторов изменения уровней (общая тенденция).
Выявление основной тенденции может быть осуществлено также методом скользящей средней. Для определения скользящей средней формируются укрупненные интервалы, состоящие из одинакового числа уровней. Каждый последующий интервал получается, постепенно сдвигаясь от начального уровня динамического ряда на один уровень вниз. Тогда первый интервал будет включать уровни у1, у2, .... уm; второй - уровни у2, у3, ... ym+1 и т.д. Таким образом, интервал сглаживания как бы скользит по динамическому ряду с шагом, равным единице. По сформированным укрупненным интервалам определятся сумма значений уровней, на основе которых рассчитываются скользящие средние. Полученная средняя относится к середине укрупненного интервала. Поэтому при сглаживании скользящей средней технически удобнее укрупненный интервал составлять из нечетного числа уровней ряда. Нахождение скользящей средней по четному числу уровней создает неудобство, вызываемое тем, что средняя может быть отнесена только к середине между двумя датами. В этом случае необходима дополнительная процедура центрирования средних. Представим порядок расчета скользящих средних, используя данные о дневном выпуске продукции предприятия за месяц (см. табл. 2).
Сглаживание динамического ряда методом скользящей средней.
Возьмем в качестве укрупненного интервала период в 3 дня, тогда первая скользящая сумма будет равна объему выпуска за первый, второй и третий рабочие дни, вторая скользящая сумма - за второй, третий и четвертый рабочие дни и т.д. В табл. 2 в гр. 3 и 4 приведены скользящие суммы за трехдневный и пятидневный промежутки. Скользящая средняя, рассчитанная по трехдневным скользящим суммам будет отнесена ко второму дню каждой трехдневки (см. гр. 5). Скользящая же средняя, рассчитанная по пятидневным суммам (см. гр. 6), относится к третьему дню соответствующей пятидневки. Нередко выбор интервала сглаживания осуществляется произвольно, однако при этом нужно учитывать количество уровней в анализируемом ряду динамики, так как при использовании приема скользящей средней сглаженный ряд сокращается по сравнению с исходным рядом на число уровней, равное (т -1). Вместе с тем, чем продолжительнее интервал сглаживания, тем сильнее усреднение, а потому выявляемая тенденция развития получается более плавной. Чаще всего интервал сглаживания может состоять из трех, пяти или семи уровней. Первоначальные и выровненные динамические ряды с помощью скользящих средних изображены на рис. 1.
Таблица 2
Изучение основной тенденции развития методом скользящей средней является лишь эмпирическим приемом предварительного анализа. Рассмотренные приемы сглаживания динамических рядов (укрупнение интервала и метод скользящей средней) могут рассматриваться как важное вспомогательное средство, облегчающее применение других методов и, в частности, более строгих методов выявления тенденции. Для того чтобы представить количественную модель, выражающую общую тенденцию изменений уровней динамического, ряда во времени, используется аналитическое выравнивание ряда динамики. В этом случае фактические уровни заменяются уровнями, вычисленными на основе определенной кривой. Предполагается, что она отражает общую тенденцию изменения во времени изучаемого показателя.
3. Выравнивание динамических рядов методом конечных разностей.
При аналитическом выравнивании ряда динамики закономерно изменяющийся уровень изучаемого показателя оценивается как функция времени EMBED Equation.3 = f(t), где EMBED Equation.3 - уровни динамического ряда, вычисленные по соответствующему аналитическому уравнению на момент времени t.
Выбор формы кривой во многом определяет результаты экстраполяции тренда. Основанием для выбора вида кривой может использоваться содержательный анализ сущности развития данного явления. Можно опираться также на результаты предыдущих исследований в данной области.
На практике для этих целей прибегают к анализу графического изображения уровней динамического ряда (линейной диаграммы). Однако из графического представления эмпирических данных не всегда удается произвести однозначный выбор формы уравнения. Поэтому целесообразно воспользоваться графическим изображением сглаженных уровней, в которых случайные и волнообразные колебания в некоторой степени оказываются погашенными (см. рис. 1).
При выборе вида кривой для выравнивания динамического ряда возможно также использование метода конечных разностей, который основан на свойствах различных кривых, применяемых при выравнивании.
Виды аппроксимируемых кривых:
Общая тенденция выражается линейным уравнением
EMBED Equation.3 = b0 + b1 t . (1)
EMBED Excel.Chart.8 \s Рис. 1
Тенденция выражается параболой второго порядка
EMBED Equation.3 = b0+ b1 t + b2t2 . (2)
Можно указать и ряд других признаков, которые могут помочь при выборе формы кривой: если примерно постоянными оказываются темпы роста, то для выравнивания применяется показательная функция; если первые разности имеют тенденцию уменьшаться с постоянным темпом, то следует остановиться на модифицированной экспоненте; если средние уровни, нанесенные на полулогарифмическую сетку, близки к прямой линии, то предпочтительнее простая экспонента; если первые разности обратных значений средних уровней изменяются на один и тот же процент, то следует остановиться на логистической кривой.
При выборе формы уравнения следует исходить из объема имеющейся информации. Чем больше параметров содержит уравнение тренда, тем больше должно быть наблюдений при одной и той же степени надежности оценивания.
4. Выравнивание ряда динамики прямой линией.
Рассмотрим аналитическое выравнивание ряда динамики по прямой, т.е. аналитическое уравнение вида:
EMBED Equation.3 = b0 + b1 t . (3)
где t - порядковый номер периодов или моментов времени.
Параметры b0 и b1 прямой рассчитываются по методу наименьших квадратов (МНК). Система нормальных уравнений в данном случае имеет вид:
EMBED Equation.3 = b0 n+ b1 EMBED Equation.3 ; (4)
EMBED Equation.3 = b0 EMBED Equation.3 + b1 EMBED Equation.3 ; (5)
Поиск параметров уравнения можно упростить, если отсчет времени производить так, чтобы сумма показателей времени изучаемого ряда динамики была равна нулю ( EMBED Equation.3 = 0). При нечетном числе уровней ряда динамики для получения EMBED Equation.3 = 0 уровень, находящийся в середине ряда, принимается за условное начало отсчета времени (этому периоду или моменту времени придается нулевое значение). Даты времени, стоящие выше этого уровня, обозначаются натуральными числами со знаком минус (-1, -2, -3 и т.д.), а ниже - натуральными числами со знаком плюс (+1, +2, +3 и т.д.) (см. гр. 3 табл. 3).
Таблица 3
Если число уровней динамического ряда четное, периоды времени верхней половины ряда (до середины) нумеруются -1, -3, -5 и т.д., а нижней ? +1.+3, +5, и т.д. При этом условии EMBED Equation.3 будет равна нулю. Система нормальных уравнений преобразуется следующим образом:
EMBED Equation.3 = b0 n; (6)
EMBED Equation.3 = b1 EMBED Equation.3 ; откуда b0 = EMBED Equation.3 = EMBED Equation.3 , b1 = EMBED Equation.3 (7)
Расчет параметров уравнения прямой представлен в табл. 3.
Используя итоги граф 2, 4, 5, определим параметры уравнения прямой:
b0 = EMBED Equation.3 = 71,22 ; b1 = EMBED Equation.3 = 3,08 . (8)
По рассчитанным параметрам записываем уравнение прямой ряда динамики, характеризующего ежемесячный объем выпуска продукции предприятием (рис. 2)
EMBED Equation.3 = 71,22 + 3,08 t . (9)
Используя приведенное уравнение, рассчитаем для каждого дня теоретические значения объема выпуска продукции (см. гр. 6 табл. 3).
Правильность расчета уровней выравниваемого ряда динамики может быть проверена следующим образом: сумма значений эмпирического ряда должна совпадать с суммой вычисленных уровней выравненного ряда, т.е. EMBED Equation.3 = EMBED Equation.3 , (см. итоги гр. 2 и 6).
Продление в будущее тенденции, наблюдавшейся в прошлом, носит название экстраполяции. Экстраполируя при t = 12, находим объем выпуска продукции в первый день следующего месяца, равный 108,13 .
Возможность экстраполяции обеспечивается двумя обстоятельствами:
1) общие условия, определяющие тенденцию развития в прошлом, не претерпевают существенных изменений в будущем;
2) тенденция развития явления характеризуется тем или иным аналитическим уравнением.
При составлении прогнозов оперируют не точечной, а интервальной оценкой, определяя так называемые доверительные интервалы прогноза. Величина доверительного интервала определяется в общем виде так:
EMBED Equation.3 EMBED Equation.3 , (10)
где S EMBED Equation.3 - среднее квадратическое отклонение от тренда;
t? - табличное значение меритерия Стьюдента при уровне значимости ?. Величина S EMBED Equation.3 определяется по формуле:
S EMBED Equation.3 = EMBED Equation.3 , (11)
EMBED Excel.Chart.8 \s
Рис. 2
где уi и EMBED Equation.3 ? соответственно фактические и расчетные значения уровней динамического ряда;
n - число уровней ряда;
m - количество параметров в уравнении тренда (для уравнения прямой т = 2).
Используя данные гр. 8 табл. 3, рассчитаем среднюю квадратическую ошибку линейного уравнения тренда:
S EMBED Equation.3 = EMBED Equation.3 = 16,202.
Отсюда величина относительной ошибки составляет EMBED Equation.3 100%= EMBED Equation.3 100% =22,75% , где EMBED Equation.3 = 1638/24=71,22 .
Величина средней квадратической ошибки может быть рассчитана иным способом, позволяющим избежать ошибки при округлениях величины (уi - EMBED Equation.3 ). Для уравнения линейного тренда EMBED Equation.3 = b0 + b1 t величина S EMBED Equation.3 определяется по формуле:
S EMBED Equation.3 = EMBED Equation.3 . (11)
Для примера, приведенного в табл. 3, получим S EMBED Equation.3 = 16,202 .
5. Выравнивание ряда динамики параболой.
Если воспользоваться для выравнивания ряда параболической формой уравнения тренда. В этом случае:
EMBED Equation.3 = b0+ b1 t + b2t2 . (12)
Система нормальных уравнений для нахождения параметров уравнения параболы (при соблюдении принципа отсчета от условного начала) будет иметь вид:
EMBED Equation.3 = b0 n + b2 EMBED Equation.3 ; (13)
EMBED Equation.3 = b1 EMBED Equation.3 ; (14)
EMBED Equation.3 = b0 EMBED Equation.3 + b2 EMBED Equation.3 . (15)
Расчет параметров этого уравнения тренда представлен в табл. 4.
Таблица 4
Подставляем итоги гр. 2, 4, 5, 6 и 7 табл. 4 и получаем систему уравнений из (13)-(15) для определения коэффициентов параболы b0 = 71,56 ; b1 = 3,076 ; b2 = -0,00788 .
Отсюда уравнение параболы второго порядка, характеризующего тенденцию ежемесячного объема выпуска продукции, будет записано так:
EMBED Equation.3 = 71,56 + 3,076 t -0,00788 t2 . (16)
EMBED Excel.Chart.8 \s
Рис. 3
Величина среднего квадратического отклонения фактических уровней динамического ряда от выравненных для уравнения параболы второго порядка определится по формуле:
S EMBED Equation.3 = EMBED Equation.3 = 16,92 . (17)
относительная ошибка уравнения составит 23,75%.
Выводы. Сравнив полученные значения S EMBED Equation.3 для уравнения прямой и параболы второго порядка, можно сделать вывод о том, что прямая более точно описывает основную тенденцию ряда динамики, характеризующего объем выработки продукции предприятием за месяц.
Приведенные расчеты следует рассматривать не как завершающую стадию прогнозирования, а лишь как предварительный этап в разработке прогноза. Для составления прогноза должна быть привлечена дополнительная информация, не содержащаяся в самом динамическом ряду.
6. Выравнивание ряда динамики показательной кривой.
Если в изменениях уровней обнаруживается тенденция к постоянству темпов роста, то выравнивание ряда следует проводить по показательной кривой:
EMBED Equation.3 = b0b EMBED Equation.3 , (18)
где b1 - коэффициент роста.
Техника выравнивания по показательной кривой аналогична технике выравнивания по прямой, за исключением того, что выравниваются здесь не уровни ряда, а их логарифмы:
EMBED Equation.3 = n lg(b0) ; (19)
EMBED Equation.3 = lg(b1) EMBED Equation.3 ; (20)
По вычисленным значениям логарифмов определяем величины параметров уравнения показательной кривой b0 и b1 табл. 5. Здесь b0 = 67,03 и b1 = 1,047.
Таблица 5
7. Методы адаптивного моделирования и прогнозирования для выравнивания рядов динамики.
Динамические ряды экономических показателей часто имеют небольшую длину и подвержены значительным колебаниям, которые аппроксимация предвидеть не может. Поэтому в практике статистического анализа экономических процессов большое распространение получили методы адаптивного моделирования и прогнозирования.
EMBED Excel.Chart.8 \s
Рис. 4
В основе адаптивных методов лежит модель экспоненциального сглаживания, возможность использования которой для прогнозирования была доказана Р. Брауном. Сущность этого метода заключается в том, что временной ряд сглаживается с помощью взвешенной скользящей средней, в которой веса распределяются по экспоненциальному закону. Такая взвешенная скользящая средняя характеризует значения динамического ряда в конце интервала сглаживания, т.е. является характеристикой последних уровней ряда.
Экспоненциальная средняя первого порядка для исходного ряда записывается следующим образом:
S EMBED Equation.3 (y) = ? EMBED Equation.3 , (21)
где S EMBED Equation.3 (y) - экспоненциальная средняя первого порядка; ? - коэффициент сглаживания.
Экспоненциальная средняя k-го порядка, соответственно, определяется следующим образом:
S EMBED Equation.3 (y) = ? S EMBED Equation.3 (y) + (1-?) S EMBED Equation.3 (y). (22)
Коэффициенты полиномов, используемых для прогнозирования, могут быть получены через сглаженные значения ряда, и для линейной модели их формулы имеют следующий вид:
а0 = 2S EMBED Equation.3 (y) - S EMBED Equation.3 (y) , (23)
а1 = EMBED Equation.3 (S EMBED Equation.3 (y) - S EMBED Equation.3 (y)) . (24)
Рассмотрим последовательность построения линейной модели на основе данных о выпуске продукции предприятием за один месяц (табл. 2).
Начальные величины S EMBED Equation.3 (y), S EMBED Equation.3 (y) могут быть получены исходя из формул (23) и (24) подстановкой параметров b0 и b1 полученных при выравнивании динамического ряда по уравнению тренда с использованием МНК.
С помощью аналитического выравнивания по прямой получаем b0 = 71,22 ; b1 = 3,08 и, соответственно, уравнение тренда EMBED Equation.3 = 71,22 + 3,08 t . Коэффициент сглаживания ? выбирается после содержательного анализа исследуемого процесса в зависимости от относительной ценности прошлых данных. Если необходимо придать больший вес последним данным, то значение ? выбирается близким к единице, если необходимо учесть большую часть имеющихся данных, то берутся небольшие значения коэффициента сглаживания. В качестве метода выбора оптимального значения ? может быть использован следующий: динамический ряд делится на две части; по первой части ряда для различных значений ? строится модель и осуществляется прогнозирование на период, соответствующий длине второй части. Оптимальное значение ? выбирается по минимальной среднеквадратической ошибке уравнения.
Таблица 6
Для дальнейших расчетов используем ???=0,5 . Система уравнений для определений S EMBED Equation.3 (y) и S EMBED Equation.3 (y) будет иметь следующий вид:
71,22 = 2S EMBED Equation.3 (y) - S EMBED Equation.3 (y) , (25)
3,08 = EMBED Equation.3 (S EMBED Equation.3 (y) - S EMBED Equation.3 (y)) . (26)
Из системы уравнений получаем S EMBED Equation.3 (y) = 68,141 , S EMBED Equation.3 (y) = 65,065 .
Для получения текущих значений скользящих средних используется формула (22), выведенная Р. Брауном. Для линейной модели значения скользящих средних определяются следующим образом:
S EMBED Equation.3 (y) = ? yt + (1-?) S EMBED Equation.3 (y).
S EMBED Equation.3 (y) = ? S EMBED Equation.3 (y) + (1-?) S EMBED Equation.3 (y).
Например, для второго дня месяца S EMBED Equation.3 (y) и S EMBED Equation.3 (y) рассчитываются следующим образом:
S EMBED Equation.3 (y) = 0,5?38,0+ 0,5?68,141 = 53,07 ;
S EMBED Equation.3 (y) = 0,5?53,07+ 0,5?65,065 = 59,07 .
Результаты расчетов скользящих средних представлены в гр. 3 и 4 табл. 6. Параметры а0 и а1 , исходя из (23) и (24),определяются с использованием уже рассчитанных в гр. 3 и 4 табл. 6 значений S EMBED Equation.3 (y) и S EMBED Equation.3 (y). Параметры а0 и а1 (см. гр. 5 и 6 табл. 6) используются в качестве коэффициентов прямой для расчета выравненных уровней. Например, для первого дня месяца 47,07-6,00 (t=l) = 41,07 и т.д. (см. гр. 7 табл. 6).
EMBED Excel.Chart.8 \s
Рис. 4
Выводы. Одним из существенных преимуществ методов, основанных на экспоненциальном сглаживании, является возможность учета временной ценности информации и адаптация к изменяющимся условиям, что имеет большое практическое значение при нестабильном протекании экономических процессов.
Экспоненциальное сглаживание как метод выравнивания лежит в основе более сложных методов адаптивного моделирования. Например, Уинтерсом была предложена модель, учитывающая сезонную составляющую динамического ряда. Эти методы могут быть использованы для оценки тенденций развития различных общественных явлений.
Варианты заданий. Варианты указаны римскими цифрами.
Таблица 7