19. За результатами опитування маємо данi (див. таблицю) про вiк і схильнiсть до ризику респондентiв. Коди самооцiнки схильностi до ризику: 1 — ризику уникаю взагалi; 2 — готовий ризикнути з певними гарантiями; 3 — люблю ризикувати. № п/п Вік, років Схильність до ризику № п/п Вік, років Схильність до ризику
1 48 1 16 45 3
2 29 2 17 23 2
3 43 2 18 61 2
4 32 2 19 33 2
5 38 2 20 42 1
6 62 1 21 27 3
7 35 1 22 37 2
8 22 3 23 65 1
9 56 3 24 40 2
10 50 2 25 49 2
11 25 3 26 57 2
12 67 1 27 19 3
13 21 3 28 70 2
14 39 1 29 36 2
15 28 2 30 52 3
Побудуйте ряди розподiлу респондентiв: а) за вiком, видiливши три групи: 1) до 30 рокiв; 2) 30 — 60; 3) 60 i старші; б) за схильнiстю до ризику, видiливши групи ризикових, обережних i неризикових iнвесторiв; в) за вiком i схильнiстю до ризику. Результати групувань подайте у виглядi статистичних таблиць. Зробіть висновки. 20. За наведеними даними побудуйте аналітичне групування, яке б описувало залежність якості роботи ткацьких верстатів від їх технічного стану (0 — пройшов планово-попереджувальний ремонт, 1 — потребує ремонту): № п/п Технічний стан верстата Число обривів нитки на 100 м2 тканини № п/п Технічний стан верстата Число обривів нитки на 100 м2 тканини
1 1 73 11 1 71
2 1 76 12 0 66
3 0 68 13 0 65
4 0 64 14 1 76
5 1 70 15 1 72
6 0 67 16 0 69
7 1 79 17 1 71
8 1 75 18 0 72
9 0 73 19 1 70
10 1 70 20 1 73
Визначте ефекти впливу технічного стану верстата на якість його роботи. Результати подайте у вигляді статистичної таблиці. . Так, загальновідомою є система рейтингової оцінки фінансового стану банків CAMEL, яка інтегрує п’ять параметрів банківської діяльності: якість капіталу, якість активів, якість банківського менеджменту, доходність, ліквідність. Кожний із зазначених параметрів оцінюється балами — від 1 (сильний) до 5 (незадовільний), які осереднюються за формулою середньої арифметичної простої. Наприклад, супервізор оцінив параметри умовного банку балами: Якість капіталу.............................2 Якість активів...............................3 Якість менеджменту....................3 Доходність....................................1 Ліквідність....................................2 _____________________ Разом 11 Середній бал становить (11 ( 5) = 2,2. За шкалою рейтингових оцінок (табл. 4.3) банк отримає рейтинг задовільного. Таблиця 4.3 Шкала рейтингових оцінок Діапазон бальних оцінок
1,0 — 1,4
1,5 — 2,4
2,5 — 3,4
3,5 — 4,4
4,5 — 5,0
Рейтинг Сильний Задовільний Посередній Граничний Незадовільний
10. Динаміка середньої очікуваної тривалості життя (в роках) землян характеризується такими даними (років): Місце 1950 — 1954 рр. 1990 — 1994 рр.
проживання Чоловіки Жінки Чоловіки Жінки
Економічно розвинені регіони Регіони, що розвиваються
63,0 40,3
68,7 41,9
71,2 59,5
78,5 62,1
За допомогою відносних величин виконайте порівняльний аналіз очікуваної тривалості життя (три аспекти). Зробіть висновки. Оцінка однорідності сукупності грунтується також на варіації часток . Для m груп середня частка , дисперсія часток , а квадратичний коефіцієнт варіації часток . Чим більша варіація часток, тим однорідніша сукупність. Розрахунок квадратичного коефіцієнта варіації часток наведено в табл. 5.7. При m = 4 середня частка становить . Коефіцієнт варіації часток для регіону А набуває значення , для регіону В — . Таблиця 5.7 Розподіл населення регіону за рівнем середньодушового доходу Середньодушовий доход за місяць, Частки Квадрати часток
гр. од. Регіон А Регіон В Регіон А Регіон В
До 75 0,2 0,1 0,04 0,01
75 — 100 0,4 0,6 0,16 0,36
100 — 125 0,3 0,2 0,09 0,04
125 і більше 0,1 0,1 0,01 0,01
Разом 1,0 1,0 0,30 0,42
Отже, за рівнем середньодушового доходу населення регіону В більш однорідне, 60 % сукупності має доход 75 — 100 гр.од. Еквівалентність цих формул підтверджують розрахунки дисперсії за даними табл. 5.12. Таблиця 5.12 Розрахунок дисперсії тарифного розряду робітників Тарифний розряд Число робітників
2 1 2 –2,6 6,76 4 4
3 3 9 –1,6 7,68 9 27
4 9 36 –0,6 3,24 16 144
5 11 55 0,4 1,76 25 275
6 16 36 1,4 1,76 36 216
Разом 30 138 ( 31,2 ( 666
Згідно з розрахунками маємо: ; ; ; ; . Отже, обидві формули дають однаковий результат. У таблиці наведено результати опитування жінок трьох країн щодо бажаної кількості дітей: Бажана кількість У % до загальної кількості опитаних у країнах
дітей А В С
0 — 1,0 0,5
1 8,8 35,3 28,4
2 22,1 53,5 38,2
3 48,2 9,4 22,6
4 13,7 0,8 8,2
5 і більше 7,2 — 2,1
Визначте модальну кількість бажаних дітей у кожній країні. У якій країні варіація цього показника найбільша? 8. За процентом високоліквідних активів у сумі поточних активів комерційні банки міста розподіляються так: Процент високоліквідних Кількість банків
активів На початок року На кінець року
До 10 1 —
10 — 20 5 1
20 — 30 9 4
30 — 40 3 9
40 і більше 2 6
Разом 20 20
Визначте середній процент високоліквідних активів і середнє квадратичне відхилення на початок і кінець року. Проведіть порівняльний аналіз середніх і варіації. 14. За даними 20%-го вибіркового обстеження тижневий обсяг хатньої праці жінок становить: Наявність дітей віком до 12 років Число обстежених сімей Обсяг хатньої праці, год Середнє квадратичне відхилення обсягу, год
Без дітей 200 26 10
Одна дитина 120 30 20
Дві і більше 80 35 15
а) Визначте середній обсяг хатньої праці за тиждень для всієї сукупності обстежених сімей та довірчий інтервал для середньої з імовірністю 0,954. б) З якою ймовірністю можна стверджувати, що тижневий обсяг хатньої праці жінок не перевищує 30 год? 15. Розподіл молодих робітників за ступенем задоволеності умовами праці та професійною мобільністю характеризується такими даними: Ступінь задоволеності Чи маєте намір змінити професію?
умовами праці Так, найближчим часом Так, у перспективі Ні Разом
Задоволений — 20 26 46
Ставлюся байдуже 7 18 9 34
Незадоволений 15 5 — 20
Разом 22 43 35 100
Проаналізуйте комбінаційний розподіл робітників, оцініть щільність зв’язку між задоволеністю умовами праці та професійною мобільністю за допомогою коефіцієнта спряженості. Перевірте істотність зв’язку з імовірністю 0,95. Метод екстраполяції дає точковий прогноз. На практиці, як правило, визначають довірчі межі прогнозного рівня , де — стандартна похибка прогнозу,t-квантиль розподілу Стьюдента (див. 6.2). яка залежить від адекватності трендової моделі — оцінки залишкової дисперсії , довжини динамічного ряду n, періоду упередження v: . Оцінка залишкової дисперсії розраховується на основі відхилень фактичних рівнів динамічного ряду від теоретичних . За даними табл. 8.5 , звідки . Таблиця 8.5 Розрахунок оцінки залишкової дисперсії t –3 –2 –1 0 1 2 3 Разом
63,5 66,8 71,0 74,3 76,9 82,2 86,8 521,5
63,1 66,9 70,7 74,5 78,3 82,1 85,9 521,5
0,4 –0,1 0,3 –0,2 –1,4 0,1 0,9 0
0,16 0,01 0,09 0,04 1,96 0,01 0,81 3,08
Значення кореня (позначимо його Z) табульовані Є. М. Четиркіним. У табл. 8.6 наведено Z для n = 7 ( 12 та v = 1 ( 3. Як бачимо, значення Z прямо пропорційні до періоду упередження v і обернено пропорційні до довжини динамічного ряду n. Таблиця 8.6 Значення Z для оцінки довірчих меж прогнозу (лінійний тренд) n v
1 2 3
5 1,366 1,524 1,702
7 1,309 1,427 1,558
8 1,267 1,358 1,459
9 1,236 1,308 1,389
10 1,211 1,270 1,335
11 1,191 1,239 1,293
12 1,174 1,215 1,260
Визначимо довірчі межі для прогнозного рівня видобутку нафти в 1998 р. з імовірністю 0,95, для якої характеристика t-критерію (Стьюдента) при шести ступенях свободи (7 – 1 = 6) становить (6) = 2,45. Значення Z для n = 7 і v = 2 згідно з табл. 8.6 становить 1,427. Отже, стандартна похибка прогнозу = 0,785 ( 1,427 = 1,12, а гранична для ймовірності 0,95 відповідно = 2,45 ( 1,12 = 2,74. Довірчі межі прогнозного рівня видобутку нафти 82,12,74, тобто з імовірністю 0,95 можна стверджувати, що в 1998 р. видобуток нафти буде щонайменше 79,4 млн т і не перевищить 84,8 млн т. 8.6. Кореляція динамічних рядів При вивченні кореляційних зв’язків на основі динамічних рядів виникають певні методологічні труднощі, спричинені залежністю рівнів, їх автокореляцією. Наявність останньої порушує одну з передумов регресійного аналізу — незалежність спостережень — і призводить до викривлення його результатів. У практиці статистико-економічного аналізу застосовують різні способи усунення автокореляції. Найпростішим є спосіб різницевих перетворень, коли замість первинних рівнів взаємозв’язаних рядів динаміки , використовують абсолютні прирости (різниці). Так, різниці першого порядку та усувають лінійний тренд, регресійне рівняння набуває такого вигляду:
де інтерпретується як звичайний коефіцієнт регресії; — вільний член рівняння. Якщо тенденція нелінійна, доцільно застосувати спосіб відхилень від тенденції, коли первинні рівні , замінюються відхиленнями від тренду Усуненню автокореляції сприяє також уведення змінної часу у рівняння регресії де вона відіграє роль фактора часу. Методику побудови такого рівняння регресії розглянемо на прикладі двох взаємозв’язаних рядів динаміки: імпорту нафти в країну і цін за барель нафти на світовому ринку. Як свідчать дані табл. 8.8, обсяги імпорту нафти в 80-ті роки систематично зменшувались; динаміка цін більш складна, проте очевидне їх зростання. Зменшення імпорту нафти пояснюється як зміною цін, так і внутрішніми факторами. Зв’язок між цими показниками можна подати лінійною функцією
де характеризує середній приріст результативної ознаки на одиницю приросту факторної ознаки ; — середній щорічний приріст під впливом зміни комплексу факторів, окрім Таблиця 8.8 Кореляція динамічних рядів Порядковий номер року Імпорт нафти, млн барелів Ціна за 1 барель , дол
1 1749 13,48 1803 –54 –36 1944 2916
2 1702 13,76 1738 –36 117 –4212 1296
3 1769 18,92 1652 117 66 7722 289
4 1600 32,97 1534 66 –21 –1386 4356
5 1431 37,29 1452 –21 –73 1533 441
6 1325 34,66 1398 –73 –46 3358 5329
7 1302 30,77 1348 –46 52 –2392 2116
8 1341 29,36 1289 52 3 156 2704
9 1232 28,07 1229 3 –30 –90 9
10 1180 16,40 1210 –3 22 –660 900
11 1162 17,79 1140 22 –54 –1188 484
Разом 15793 273,42 ( 0 0 4785 20840
Параметри рівняння визначаються методом найменших квадратів, система нормальних рівнянь складається традиційно:
Якщо початок відліку часу перенести в середину динамічного ряду, то Необхідні розрахункові величини за даними табл. 8.8 такі:
Розв’язавши систему, дістанемо такі значення параметрів: = = 1531,176; = –3,842; Тобто підвищення ціни одного бареля нафти на долар зменшує імпорт нафти в країну в середньому на 3,842 млн барелів. За рахунок інших факторів, які рівномірно змінюються в часі, передусім політики енергозбереження, імпорт нафти щорічно зменшується в середньому на 64,592 млн барелів. Особливістю регресійного аналізу динамічних рядів є оцінка автокореляції залишкових величин Якщо регресійна модель не адекватна реальному зв’язку між ознаками, то автокореляція залишків виявиться істотною. Мірою автокореляції залишків є коефіцієнт, аналогічний коефіцієнту парної кореляції. Обчислення його грунтується на співвідношенні залишків первинного динамічного ряду з рядом залишків, зсунутим на певний лаг тобто рядом Найважливішим є лаг У такому разі корелюються ряди залишків: , . Останнє значення зсунутого ряду замінюється першим: Очевидно, що а формула коефіцієнта автокореляції має вигляд
Значення коливається в межах від –1 до +1, за відсутності автокореляції Необхідні для розрахунку коефіцієнта автокореляції величини наведені в табл. 8.8. Згідно з даними таблиці ; . Отже, , що свідчить про низький ступінь автокореляції залишкових величин регресійної моделі імпорту нафти. Для перевірки істотності коефіцієнта автокореляції використовують таблицю критичних значень , фрагмент якої наведено в табл. 8.9. Таблиця 8.9 Критичні значення циклічного коефіцієнта автокореляції при = 0,05 n Додатні значення Від’ємні значення
5 0,253 –0,753
7 0,370 –0,674
9 0,366 –0,593
11 0,353 –0,539
15 0,328 –0,462
Для критичне значення вище за фактичне, це дає підстави стверджувати з імовірністю 0,95, що автокореляція залишкових величин неістотна. 9.7. Індексні ряди При вивченні динаміки широко використовуються індексні ряди. База порівняння може бути постійною чи змінною, відповідно, індексні ряди — базисними або ланцюговими. Вибір бази порівняння залежить від мети дослідження. Ряди базисних індексів дають уявлення про загальну тенденцію явища, ряди ланцюгових індексів — докладнішу картину послідовних змін явища в часі. У табл. 9.7 наведено поквартальні індекси цін на електроенергію з різною базою порівняння. Для четвертого кварталу 1997 р., наприклад, маємо чотири індекси. Усі вони відображують об’єктивно існуючу динаміку ціни за цей період. Це чотири версії однієї динаміки з різним масштабом співвідношення. Так, порівняно з третім кварталом ціна зросла на 2%, а порівняно з четвертим кварталом 1996 р. — на 14%. Таблиця 9.7 Індексні ряди з різним масштабом співвідношення Період Індекси
Квартал Рік (база порівняння становить 1)
IV 1996 1
I 1997 1,05 1
II 1997 1,08 1,03 1
III 1997 1,12 1,07 1,04 1
IV 1997 1,14 1,09 1,06 1,02
Перехід від одного масштабу співвідношення до іншого здійснюється перебазуванням індексів: = 1,04 ( 1,02 = 1,06, = 1,03 ( 1,04 ( 1,02 = 1,09 і т. д. Добуток послідовно ланцюгових індексів дорівнює відповідному базисному. При побудові індексних рядів зведених індексів постійною або змінною може бути не лише база порівняння, а й ваги (сумірники) індексів. Як приклад наведемо ряди індексів цін: базисних з постійними вагами: ...; ; базисних зі змінними вагами: ...; ; ланцюгових зі змінними вагами: ...; ; ланцюгових з постійними вагами: ...; . Теоретично будь-який ряд можна використати в аналізі динаміки. Практично поширеніші індекси з постійними вагами, які елімінують (усувають) вплив структурних зрушень на величину індексу. Окрім того, в індексних рядах з постійними вагами можна здійснити перебазування — перейти від ланцюгових індексів до базисних, і навпаки. В індексних рядах зі змінними вагами перебазування індексів неможливе. На основі індексних рядів провадиться моніторинг динамічних процесів, зокрема кон’юнктури ринку цінних паперів. Спеціальні фірми-спостерігачі вивчають тенденції біржового ринку, оцінюють активність біржової діяльності та ступінь ризику інвесторів. В моніторингу кон’юнктури біржового ринку використовуються різні індекси: середньоарифметичні (зважені та незважені), середньогармонічні зважені, середньогеометричні. На підставі їх здійснюються прогнози. Всі ці дані публікуються в доступній для широкого загалу формі.