20. За І квартал фірмою реалізовано продукції на 21,6 млрд грн. Залишки обігових коштів становили, млн грн.: на 1 січня — 1400; на 1 лютого — 1550; на 1 березня — 1270; на 1 квітня — 1600.
Визначіть середньомісячний залишок обігових коштів.
21. Поясніть, за яких умов використовується середня геометрична.
22. Що характеризує багатовимірна середня? Яку аналітичну функцію вона виконує у статистичному аналізі?
23. Як ви уявляєте систему статистичних показників? Поясніть на конкретному прикладі.
5. РЯДИ РОЗПОДІЛУ. АНАЛІЗ ВАРІАЦІЙ ТА ФОРМИ РОЗПОДІЛУ
5.1. Закономірність розподілу
Статистична сукупність формується під впливом причин та умов, з одного боку — типових, спільних для всіх елементів сукупності, а з іншого — випадкових, індивідуальних. Ці чинники взаємозв’язані, а їх спільна взаємодія визначає як індивідуальні значення ознак, так і розподіл останніх у межах сукупності. Характерні властивості структури статистичної сукупності відбиваються в рядах розподілу.
Ряд розподілу складається з двох елементів: варіант — значень групувальної ознаки xj та частот (часток) fj. Саме у співвідношенні варіант і частот виявляється закономірність розподілу.
Залежно від статистичної природи варіант ряди розподілу поділяються на атрибутивні та варіаційні. Частотними характеристиками будь-якого ряду є абсолютна чисельність j-ї групи — частота fj та відносна частота j-ї групи — частка dj. Очевидно, що, а , або 100%. Додатковою характеристикою варіаційних рядів є кумулятивна частота (частка), що являє собою результат послідовного об’єднання груп і підсумовування відповідних їм частот (часток). Кумулятивна частота (частка ) характеризує обсяг сукупності зі значеннями варіант, які не перевищують xj (табл. 5.1).
Варіаційний ряд може бути дискретним або інтервальним. Якщо варіаційний ряд інтервальний з нерівними інтервалами, то його частотні характеристики непорівнянні. Тоді, аналізуючи розподіл, використовують щільність частоти (частки) на одиницю інтервалу, тобто або .
Таблиця 5.1
ЧАСТОТНІ ХАРАКТЕРИСТИКИ РЯДІВ РОЗПОДІЛУ
Значення варіант хj
Частоти fj
Частки dj
Кумулятивні




частоти
частки

х1
f1
d1
f1
d1

х2
f2
d2
f1 + f2
d1 + d2

х3
f3
d3
f1 + f2 + f3
d1 + d2 + d3

...
...
...
...
...

хm
fm
dm

1

Разом

1
(
(


Як приклад розглянемо розподіл фірм регіону за рівнем фондоозброєності праці в розрахунку на одного працюючого (табл. 5.2). Згідно зі значеннями кумулятивних часток на більшості фірм (50,6%) фондоозброєність праці не перевищує 5 млн грн. Щільність розподілу зі зростанням ширини інтервалу зменшується.
Таблиця 5.2
РОЗПОДІЛ ФІРМ РЕГІОНУ ЗА РІВНЕМ ФОНДООЗБРОЄНОСТІ ПРАЦІ
Фондоозброєність праці, млн грн.
Часткаdj, %
Кумулятивна частка
Щільність частки gj, %

1 — 2
13,4
13,4
13,4

2 — 5
37,2
50,6
12,4

5 — 10
23,5
74,1
4,7

10 — 20
16,8
90,9
4,7

20 — 50
9,1
100,0
0,3

Разом
100
(
(


Кожний розподіл має характерні особливості. Найтиповіші з них подано в рядах розподілу (табл. 5.3). Групувальною ознакою є тарифний розряд, значення якого варіюють у межах від 2 до 6. Припустимо, що розподіли робітників умовних професій за рівнем кваліфікації різні. Так, у рядах А і В розподіл частот однаковий, але центри розподілу, навколо яких групуються індивідуальні значення, різні: в ряду А — 5-й розряд, в ряду В — 4-й. У рядах С, D, К центр розподілу такий самий, як і в ряду В, — 4-й, проте форма розподілу різна. Ряди В і С різняться межами варіації; у рядах С і D при однакових межах варіації і симетричному розподілі частот різний ступінь витягнутості вздовж осі ординат, різна крутизна розподілу: у розподілі С лише 36% обсягу сукупності групується навколо центра, у розподілі D — 76% обсягу. Розподіл К відрізняється від інших асиметричністю відносно центра.
Таблиця 5.3
РОЗПОДІЛ РОБІТНИКІВ ЗА РІВНЕМ КВАЛІФІКАЦІЇ
Тарифнийрозряд
Професії


А
В
С
D
К

2


7
2
1

3

25
25
10
4

4
25
50
36
76
58

5
50
25
25
10
27

6
25

7
2
10

Разом
100
100
100
100
100


Отже, поглиблений аналіз закономірностей розподілу передбачає характеристику зазначених особливостей сукупності, зокрема:
а) визначення типового рівня ознаки, який є центром тяжіння;
б) вимірювання варіації ознаки, ступеня згрупованості індивідуальних значень ознаки навколо центра розподілу;
в) оцінювання особливостей варіації, ступеня її відхилення від симетрії;
г) оцінювання нерівномірності розподілу значень ознаки між окремими елементами сукупності, тобто ступінь їх концентрації.
Базою аналізу закономірностей розподілу є варіаційний ряд — дискретний або інтервальний — з рівними інтервалами.
5.2. Характеристики центра розподілу
Центром тяжіння будь-якої статистичної сукупності є типовий рівень ознаки, узагальнююча характеристика всього розмаїття її індивідуальних значень. Такою характеристикою є середня величина . За даними ряду розподілу середня обчислюється як арифметична зважена; вагами є частоти fj або частки dj:
, ,
де j — номер групи; m — число груп.
В інтервальних рядах, припускаючи рівномірний розподіл елементів сукупності в межах j-го інтервалу, як варіанту використовують середину інтервалу. При цьому ширину відкритого інтервалу умовно вважають такою самою, як сусіднього закритого інтервалу.
Дані для розрахунку середнього рівня в інтервальному ряду розподілу наведено в табл. 5.4. Згідно з розрахунками, у середньо-му на одного члена домогосподарства припадає = 1800 : 200 = = 9 м2 житлової площі. Це типовий рівень забезпеченості населення житлом.
Таблиця 5.4
РОЗПОДІЛ ДОМОГОСПОДАРСТВ МІСТА ЗА РІВНЕМ ЗАБЕЗПЕЧЕНОСТІ ЖИТЛОМ
Житлова площа на одного члена домогосподарства, м2
Кількість домо-господарств fj
xj
xj fj
Кумулятивна частка

До 5
17
4
68
17

5 — 7
39
6
234
56

7 — 9
51
8
408
107

9 — 11
42
10
420
149

11 — 13
29
12
348
178

13 — 15
15
14
210
193

15 і більше
7
16
112
200

Разом
200
(
1800
(


Окрім типового рівня важливе значення має домінанта, тобто найбільш поширене значення ознаки. Таке значення називають модою (Мо). У дискретному ряду моду визначають безпосередньо за найбільшою частотою (часткою). Наприклад, якщо депозитна ставка у восьми комерційних банків — 12% річних, а в двох — 10%, то модальною є ставка 12%.
В інтервальному ряду за тим самим принципом визначається модальний інтервал, а в разі потреби конкретне модальне значення в середині інтервалу обчислюється за інтерполяційною формулою
,
де та h — відповідно нижня межа та ширина модального інтервалу, , , — частоти (частки) відповідно модального, передмодального та післямодального інтервалів.
За даними табл. 5.4 модальним є інтервал 7 — 9, що має найбільшу частоту ; ширина модального інтервалу h = 2; нижня межа х0 = 7; передмодальна частота = 39, післямодальна — = 42. За такого співвідношення частот модальне значення забезпеченості населення житлом:
= 8,1 м2.
Для моди як домінанти число відхилень (х – Мо) мінімальне. Оскільки мода не залежить від крайніх значень ознаки, то її до-цільно використовувати тоді, коли ряд розподілу має невизначені межі.
Характеристикою центра розподілу вважається також медіана (Ме) — значення ознаки, яке припадає на середину впорядкованого ряду, поділяє його навпіл — на дві рівні за обсягом частини. Визначаючи медіану, використовують кумулятивні частоти або частки . У дискретному ряду медіаною буде значення ознаки, кумулятивна частота якого перевищує половину обсягу сукупності, тобто (для кумулятивної частки ).
В інтервальному ряду за цим принципом визначають медіанний інтервал, а значення медіани в середині інтервалу, як і значення моди, обчислюють за інтерполяційною формулою:
,
де x0 та h — відповідно нижня межа та ширина медіанного інтервалу; fme — частота медіанного інтервалу; — кумулятивна частота передмедіанного інтервалу.
За даними табл. 5.4 половина обсягу сукупності припадає на інтервал 7 — 9 з частотою = 51; передмедіанна кумулятивна частота = 56. Отже, медіана забезпеченості населення житлом:
м2.
У симетричному розподілі всі три зазначені характеристики центра розподілу однакові: , у помірно асиметричному відстань медіани до середньої втричі менша за відстань середньої до моди, тобто . Саме таке співвідношення характеристик центра розподілу в розглянутому прикладі:
3 (9 – 8,7) = 9 – 8,1.
Медіана, як і мода, не залежить від крайніх значень ознаки; сума модулів відхилень варіант від медіани мінімальна, тобто вона має властивість лінійного мінімуму:
.
Цю властивість медіани можна використати при проектуванні розміщення зупинок міського транспорту, заготівельних пунктів тощо.
Окрім моди і медіани, в аналізі закономірностей розподілу використовуються також квартилі та децилі. Квартилі — це варіанти, які поділяють обсяги сукупності на чотири рівні частини, децилі — на десять рівних частин. Ці характеристики визначаються на основі кумулятивних частот (часток) за аналогією з медіаною, яка є другим квартилем або п’ятим децилем.
У ряду розподілу (див. табл. 5.4) перший квартиль становить 6,7 м2, перший дециль — 5,2 м2, дев’ятий — 13,3 м2 :
;
;
.
Отже, у 25% сімей забезпеченість житлом не перевищує 6,7 м2, серед 10% малозабезпечених найвищий рівень становить 5,2 м2, а серед 10% найбільш забезпечених нижня межа — 13,3 м2.
5.3. Характеристики варіації
В одних сукупностях індивідуальні значення ознаки щільно групуються навколо центра розподілу, в інших — значно відхиляються. Чим менші відхилення, тим однорідніша сукупність, а отже, тим більш надійні й типові характеристики центра розподілу, передусім середня величина. Вимірювання ступеня коливання ознаки, її варіації — невід’ємна складова аналізу закономірностей розподілу. Міри варіації широко використовуються у практичній діяльності: для оцінювання диференціації домашніх господарств за рівнем доходу, фінансового ризику інвестування, ритмічності роботи підприємств, сталості врожайності сільськогосподарських культур тощо.
На основі характеристик варіації оцінюється інтенсивність структурних зрушень, щільність взаємозв’язків соціально-економічних явищ, точність результатів вибіркового обстеження.
Для вимірювання та оцінювання варіації використовуються абсолютні та відносні характеристики. До абсолютних належать: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні характеристики подаються низкою коефіцієнтів варіації, локалізації, концентрації.
Варіаційний розмах R — це різниця між максимальним і мінімальним значеннями ознаки: R = xmax – xmin. Він характеризує діапазон варіації, наприклад родючості ґрунтів у регіоні, продуктивності праці в галузях промисловості тощо. Безперечною перевагою варіаційного розмаху як міри варіації є простота його обчислення й тлумачення.
Проте, коли частоти крайніх варіант надто малі, варіаційний розмах неадекватно характеризує варіацію. У таких випадках використовують квартильні або децильні розмахи. Квартильний розмах охоплює 50% обсягу сукупності, децильний — 60% або — 80%.
Інші абсолютні характеристики варіації враховують усі відхилення значень ознаки від центра розподілу, поданого середньою величиною. Оскільки алгебраїчна сума відхилень , то використовуються або модулі відхилень , або квадрати відхилень . Узагальнюючою характеристикою варіації є середнє відхилення:
а) лінійне
;
б) квадратичне, або стандартне
;
в) дисперсія (середній квадрат відхилень)
.
На підставі первинних, незгрупованих даних наведені характеристики обчислюють за принципом незваженої середньої:
або .
Середнє лінійне та середнє квадратичне відхилення є безпосередніми мірами варіації. Це іменовані числа (в одиницях вимірювання ознаки), за змістом вони ідентичні, проте завдяки математичним властивостям . Коли обсяг сукупності досить великий і розподіл ознаки, що варіює, наближається до нормального, то , а . Значення ознаки в межах  мають 68,3% обсягу сукупності, у межах — 95,4%, у межах — 99,7%. Це відоме «правило трьох сигм». При значній асиметрії розподілу (див. підрозд. 5.4) розрахунок не має сенсу.
На основі взаємозв’язку між варіаційним розмахом R, середнім квадратичним відхиленням і чисельністю сукупності n Р. Пірсон обчислив коефіцієнти k, за допомогою яких орієнтовно можна визначити середнє квадратичне відхилення за варіаційним розмахом: . Значення коефіцієнтів k наведено в табл. 5.5.
Таблиця 5.5
КОЕФІЦІЄНТИ k ДЛЯ РІЗНОГО ОБСЯГУ СУКУПНОСТІ
n
10
20
30
40
50
100
200

k
0,32
0,27
0,24
0,23
0,22
0,20
0,18


Очевидний взаємозв’язок середнього квадратичного відхилення та дисперсії: . Дисперсія входить до більшості теорем теорії ймовірностей, які є фундаментом математичної статистики, і широко використовується для вимірювання зв’язку й перевірки статистичних гіпотез. Види та властивості дисперсій розглядаються в підрозд. 5.5.
При порівнянні варіації різних ознак або однієї ознаки в різних сукупностях використовуються коефіцієнти варіації V. Вони визначаються відношенням абсолютних іменованих характеристик варіації (, , R) до центра розподілу, найчастіше виражаються у процентах. Значення цих коефіцієнтів залежить від того, яка саме абсолютна характеристика варіації використовується. Отже, маємо коефіцієнти варіації:
лінійний ;
квадратичний ;
осциляції .
Якщо центр розподілу поданий медіаною, то за відносну міру варіації беруть квартильний коефіцієнт варіації
.
Для оцінювання ступеня варіації застосовують також співвідношення децилів. Так, коефіцієнт децильної диференціації показує кратність співвідношення дев’ятого та першого децилів:
.
Необхідні для розрахунку узагальнюючих характеристик варіації величини подано в табл. 5.6 на прикладі розподілу домогосподарств за рівнем забезпеченості житлом. Середня розподілу становить 9 м2.
Таблиця 5.6
ДО РОЗРАХУНКУ УЗАГАЛЬНЮЮЧИХ ХАРАКТЕРИСТИК ВАРІАЦІЇ
xj
fj





4
17
–5
85
25
425

6
39
–3
117
9
351

8
51
–1
51
1
51

10
42
1
42
1
42

12
29
3
87
9
261

14
15
5
75
25
375

16
7
7
49
49
343

Разом
200
(
506
(
1848


Згідно з розрахунками:
2,53 м2;
;
м2;
.
Децильний коефіцієнт VD = 13,3 : 5,2 = 2,5 показує, що нижня межа 10% відносно забезпечених житлом домогосподарств в 2,5 раза перевищує верхню межу 10% малозабезпечених домогосподарств.
5.4. Характеристики форми розподілу
Аналіз закономірностей розподілу передбачає оцінювання ступеня однорідності сукупності, асиметрії та ексцесу розподілу.
Однорідність сукупності — передумова використання інших статистичних методів (середніх величин, регресійного аналізу тощо). Однорідними вважаються такі сукупності, елементи яких мають спільні властивості і належать до одного типу, класу. При цьому однорідність означає не повну тотожність властивостей елементів, а лише наявність у них спільного в істотному, головному.
В однорідних сукупностях розподіли одновершинні (одномодальні). Багатовершинність свідчить про неоднорідний склад сукупності, про різнотиповість окремих складових. У такому разі необхідно перегрупувати дані, виокремити однорідні групи. Критерієм однорідності сукупності вважається квадратичний коефіцієнт варіації, який завдяки властивостям в симетричному розподілі становить . Згідно з цим критерієм сукупність домогосподарств за рівнем забезпеченості житлом практично однорідна ().
З-поміж одновершинних розподілів є симетричні та асиметричні (скошені), гостро- та плосковершинні. У симетричному розподілі рівновіддалені від центра значення ознаки мають однакові частоти, в асиметричному — вершина розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Якщо вершина зміщена ліворуч, маємо правосторонню асиметрію, і навпаки. Зазначимо, що асиметрія виникає внаслідок обмеженої варіації в одному напрямі або під впливом домінуючої причини розвитку, яка призводить до зміщення центра розподілу. Ступінь асиметрії різний — від помірного до значного.
Як уже зазначалося, у симетричному розподілі характеристики центра — середня, мода, медіана — мають однакові значення, в асиметричному між ними існують певні розбіжності. У разі правосторонньої асиметрії , а в разі лівосторонньої, навпаки, . Чим більша асиметрія, тим більше відхилення (). Очевидно, найпростішою мірою асиметрії є відносне відхилення , яке характеризує напрям і міру скошеності в середині розподілу; при правосторонній асиметрії , при лівосторонній — .
Теоретично коефіцієнт асиметрії не має меж, проте на практиці його значення не буває надто великим і в помірно скісних розподілах не перевищує одиниці. Так, за даними ряду розподілу (див. табл. 5.4) середній рівень забезпеченості населення житлом становить 9 м2, мода дорівнює 8,1, . Міра скошеності свідчить про помірну правосторонню асиметрію розподілу. Такого самого висновку можна дійти на основі співвідношення середнього квадратичного та середнього лінійного відхилень: .
Іншою властивістю одновершинних розподілів є ступінь зосередженості елементів сукупності навколо центра розподілу. Цю властивість називають ексцесом розподілу.
Асиметрія та ексцес — дві пов’язані з варіацією властивості форми розподілу. Комплексне їх оцінювання виконується на базі центральних моментів розподілу. Алгебраїчно центральний момент розподілу — це середня арифметична k-го ступеня відхилення індивідуальних значень ознаки від середньої:
.
Очевидно, що момент 2-го порядку є дисперсією, яка характеризує варіацію. Моменти 3-го і 4-го порядків характеризують відповідно асиметрію та ексцес. У симетричному розподілі . Чим більша скошеність ряду, тим більше значення . Для того щоб характеристика скошеності не залежала від масштабу вимірювання ознаки, для порівняння ступеня асиметрії різних розподілів використовується стандартизований момент , який на відміну від коефіцієнта скошеності залежить від крайніх значень ознаки. При правосторонній асиметрії коефіцієнт , при лівосторонній . Звідси правостороння асиметрія називається додатною, а лівостороння — від’ємною. Уважається, що при асиметрія низька, якщо не перевищує 0,5 — середня, при — висока.
Для вимірювання ексцесу використовується стандартизований момент 4-го порядку . У симетричному, близькому до нормального розподілі . Очевидно, при гостровершинному розподілі , при плосковершинному .
Аналіз закономірностей розподілу можна поглибити, описати його певною функцією.
Не менш важливими у статистичному аналізі є характеристика нерівномірності розподілу певної ознаки між окремими складовими сукупності, а також оцінка концентрації значень ознаки в окремих її частинах (наприклад, розподіл майна чи доходів між окремими групами населення, кількості зайнятих між окремими галузями промисловості, площі сільськогосподарських угідь між окремими агрогосподарствами).
Так, наведені в табл. 5.8 дані про розподіл промислових підприємств регіону за вартістю основних виробничих фондів і за обсягами спожитої електроенергії свідчать про нерівномірне споживання електроенергії. До першої групи належить 20% підприємств, а частка спожитої електроенергії становить 4%. Натомість шоста група містить 3% підприємств, які споживають 46% електроенергії. На відхиленнях часток двох розподілів — за кількістю елементів сукупності dj і обсягом значень ознаки Dj — ґрунтується оцінювання концентрації.
Таблиця 5.8
ДО РОЗРАХУНКУ КОЕФІЦІЄНТА КОНЦЕНТРАЦІЇ
Вартість основних виробничих фондів, грн.
У % до підсумку
Модуль відхилення часток


Кількість підприємств dj
Спожито електроенергії Dj


До 5
20
4
0,16

5 — 10
38
5
0,33

10 — 20
22
8
0,14

20 — 50
13
12
0,01

50 — 100
4
25
0,21

100 і більше
3
46
0,43

Разом
100
100
1,28


Якщо розподіл значень ознаки в сукупності рівномірний, то частки однакові — , відхилення часток свідчать про певну концентрацію. Верхня межа суми відхилень , а тому коефіцієнт концентрації обчислюється як півсума модулів відхилень:
.
Значення коефіцієнта коливаються в межах від нуля (рівномірний розподіл) до одиниці (повна концентрація). Чим більший ступінь концентрації, тим більше значення коефіцієнта K. У нашому прикладі K = 1,28 : 2 = 0,64, що свідчить про високий ступінь концентрації споживання електроенергії у промисловості регіону.
Коефіцієнти концентрації широко використовуються в регіональному аналізі для оцінювання рівномірності територіального розподілу виробничих потужностей, фінансових ресурсів тощо. За кожним регіоном визначається також коефіцієнт локалізації
,
який характеризує співвідношення часток.
За даними табл. 5.9 коефіцієнти локалізації свідчать про нерівномірність купівлі (продажу) на душу населення і певною мірою про варіацію життєвого рівня населення різних регіонів.
Таблиця 5.9
КОЕФІЦІЄНТИ ТЕРИТОРІАЛЬНОЇ ЛОКАЛІЗАЦІЇ
Регіон
У % до підсумку
Коефіцієнти локалізації Lj, %


Чисельність населення dj
Обсяг товарообороту Dj


А
30
34
113

В
50
42
84

С
20
24
120

Разом
100
100
*


Порівняння структур на основі відхилень часток доцільне в рядах з нерівними інтервалами, а надто в атрибутивних рядах.
За аналогією з коефіцієнтом концентрації обчислюється коефіцієнт подібності (схожості) структур двох сукупностей:
.
Якщо структури однакові, Р = 1; якщо абсолютно протилежні, Р = 0. Чим більше схожі структури, тим більше значення Р. За наведеними у табл. 5.10 даними про галузеву структуру зайнятості населення у двох країнах коефіцієнт подібності структур становить:
,
тобто розподіл зайнятих за галузями економіки відхиляється в середньому на 18 п. п.
Таблиця 5.10
ГАЛУЗЕВА СТРУКТУРА ЗАЙНЯТОСТІ НАСЕЛЕННЯ
Країна
Структура зайнятих, %


Сільське господарство
Промисловість та будівництво
Сфера послуг

А
36
24
40

В
25
42
33


Структура будь-якої статистичної сукупності динамічна. Змінюються склад і технічний рівень виробничих фондів, вікова й професійна структура робітників, склад і якість залучених до виробництва природних ресурсів, асортимент і якість продукції, що виробляється, структура споживчого бюджету тощо. Зміна часток окремих складових сукупності свідчить про структурні зрушення. Так, за даними табл. 5.11 структура спожитого в регіоні палива (у перерахунку на умовне) змінилася: зменшились частки газу та мазуту, зросли частки вугілля та інших видів палива. Інтенсивність структурних зрушень оцінюється за допомогою середнього лінійного або середнього квадратичного відхилень часток:
;
,
де dj0 та dj1 — частки відповідно базисного та поточного періоду; m — число складових сукупності.
Таблиця 5.11
СТРУКТУРА ТА СТРУКТУРНІ ЗРУШЕННЯСПОЖИВАННЯ ПАЛИВА ПО РОКАХ
Вид палива
1995 р., d0
2000 р.,d1
Відхилення часток, d1 – d0
Модулі відхилень,
Квадрати відхилень,

Вугілля
29
42
13
13
169

Газ
23
16
– 7
7
49

Мазут
45
36
– 9
9
81

Інші види
3
6
+ 3
3
9

Разом
100
100
0
32
308

Лінійний коефіцієнт структурних зрушень становить , тобто частки окремих видів палива змінилися в середньому на 8 п. п. Завдяки своїм математичним властивостям квадратичний коефіцієнт структурних зрушень дещо більший — п. п.
5.5. Види та взаємозв’язок дисперсій
Дисперсія посідає особливе місце у статистичному аналізі соціально-економічних явищ. На відміну від інших характеристик варіації завдяки своїм математичним властивостям вона є невіддільним і важливим елементом інших статистичних методів, зокрема дисперсійного аналізу.
Для ознак метричної шкали дисперсія — це середній квадрат відхилень індивідуальних значень ознаки від середньої:
.
Як і будь-яка середня, дисперсія має певні математичні властивості. Сформулюємо найважливіші з них.
1. Якщо всі значення варіант xj зменшити на сталу величину А, то дисперсія не зміниться:
.
2. Якщо всі значення варіант xj змінити в А раз, то дисперсія зміниться в A2 раз:
.
3. Якщо частоти замінити частками, дисперсія не зміниться.
Нескладними алгебраїчними перетвореннями можна довести, що дисперсія — це різниця квадратів . Якщо
,
то, замінивши і поділивши всі складові на n, дістанемо:
,
де — квадрат середньої величини; — середній квадрат значень ознаки.
Дисперсія альтернативної ознаки обчислюється як добуток часток: , де — частка елементів сукупності, яким властива ознака, — частка решти елементів . Застосуємо основну формулу дисперсії до цих характеристик структури:

Якщо, скажімо, у збиральному цеху частка висококваліфікованих робітників становить , то дисперсія частки .
Дисперсія альтернативної ознаки широко використовується при проектуванні вибіркових обстежень, обробці даних соціологічних опитувань, статистичному контролі якості продукції тощо. За відсутності первинних даних про розподіл сукупності припускають, що і використовують максимальне значення дисперсії (див. підрозд. 6.4).
Якщо сукупність розбито на групи за певною ознакою х, то для будь-якої іншої ознаки у можна обчислити дисперсію як у цілому по сукупності, так і в кожній групі. Центром розподілу сукупності в цілому є загальна середня , центром розподілу в j-й групі — групова середня . Відхилення індивідуальних значень ознаки у від загальної середньої можна подати як дві складові: . Узагальнюючими характеристиками цих вiдхилень є дисперсії: загальна, групова та міжгрупова.
Загальна дисперсія характеризує варіацію ознаки у навколо загальної середньої:
.
Групова дисперсія характеризує варіацію відносно групової середньої:
.
Оскільки в групи об’єднуються певною мірою схожі елементи сукупності, то варіація в групах, як правило, менша, ніж у цілому по сукупності. Якщо причинні комплекси, що формують варіацію в різних групах, неоднакові, то й групові дисперсії різняться між собою.
Узагальнюючою мірою внутрішньогрупової варіації є середня з групових дисперсій:
.
Різними є й групові середні . Мірою варіації їх навколо загальної середньої є міжгрупова дисперсія
.
Отже, загальна дисперсія складається з двох частин. Перша характеризує внутрішньогрупову, друга — міжгрупову варіацію.
Взаємозв’язок дисперсій називається правилом розкладання (декомпозиції) варіації:
.
Розглянемо розрахунок зазначених дисперсій на прикладі варіації якості твердого сиру у залежно від терміну його зберігання х. Результати вибіркового обстеження якості 20 партій сиру, розподіл їх за терміном зберігання (1, 2, 3 місяці), розрахунки середніх та дисперсій наведено в табл. 5.13. Згідно з даними таблиці маємо:
1) середній бал якості сиру (за 10-бальною шкалою)
;
2) загальна дисперсія балів якості
;
3) групові середні бали якості та групові дисперсії:
;
;

;
;

;
.

Таблиця 5.13
РОЗРАХУНОК ЗАГАЛЬНОЇ ТА ГРУПОВИХ ДИСПЕРСІЙ ЯКОСТІ СИРУ
№ з/п
Термін зберігання х, міс.
Бал якості, y
Розрахунок дисперсій якості




загальної
групових





1-ша група
2-га група
3-тя група





у

у

у


1
2
7,3
0,01


7,3
0,01



2
1
8,8
1,96
8,8
0,01





3
1
8,4
1,00
8,4
0,09





4
3
6,5
0,81




6,5
0,36

5
2
7,5
0,01


7,5
0,09



6
3
6,4
1,00




6,4
0,25

7
1
9,1
2,89
9,1
0,16





8
1
8,6
1,44
8,6
0,01





9
3
5,7
2,89




5,7
0,04

10
2
6,8
0,36


6,8
0,16



11
2
7,7
0,09


7,7
0,25



12
3
5,6
3,24




5,6
0,09

13
1
8,9
2,25
8,9
0,04





14
2
7,8
0,16


7,8
0,36



15
3
5,3
4,41




5,3
0,36

16
1
8,5
1,21
8,5
0,04





17
2
6,8
0,36


6,8
0,16



18
2
7,1
0,09


7,1
0,01



19
1
8,6
1,44
8,6
0,01





20
2
6,6
0,64


6,6
0,36



Разом

148,0
26,26
60,9
0,36
57,6
1,4
29,5
1,1

Середня

7,4

8,7

7,2

5,9


Дисперсія


1,313

0,051

0,175

0,220

Значення групових середніх підтверджують залежність якості сиру від терміну його зберігання. У 1-й групі середній бал якості становить 8,7, у 2-й групі якість сиру знижується на 1,5 бала, а в 3-й зниження якості порівняно з першою групою становить 2,8 бала. Водночас зростає варіація балів у групах, що відбиває посилення впливу інших чинників на якість сиру.
Необхідні величини для розрахунку середньої з групових і міжгрупової дисперсій наведено в табл. 5.14.
Таблиця 5.14
ДО РОЗРАХУНКУ МІЖГРУПОВОЇ ТА СЕРЕДНЬОЇ З ГРУПОВИХ ДИСПЕРСІЙ
Групи за терміном зберігання, міс.
Число партій
Середній бал якості
Групова дисперсія
Розрахунок дисперсій





середньої з групових
міжгрупової









1
7
8,7
0,051
0,36
1,3
11,83

2
8
7,2
0,175
1,40
– 0,2
0,32

3
5
5,9
0,220
1,10
– 1,5
11,25

Разом
20
7,4
(
2,86
(
23,4


За даними таблиці міжгрупова дисперсія становить

середня з групових дисперсій
.
Сума їх дорівнює загальній дисперсії: 0,143 + 1,170 = 1,313.
Міжгрупова варіація — це результат впливу фактора, який покладено в основу групування, внутрішньогрупова — інших факторів, окрім групувального. Відношення міжгрупової дисперсії до загальної характеризує частку варіації результативної ознаки у, яка пов’язана з варіацією групувальної ознаки. Це відношення називають кореляційним і позначають символом :
.
У розглянутому прикладі кореляційне відношення становить , тобто 84,2% варіації якості сиру пов’язані з терміном зберігання. На інші фактори припадає 100 – 84,2 == 15,8% варіації.
Правило декомпозиції варіації є основою вимірювання щільності зв’язку.
ЗАВДАННЯ ДЛЯ САМОКОНТРОЛЮ
1. Як виявляється закономірність розподілу?
2. Назвіть особливості частотних характеристик розподілу.
3. Чому саме середню розглядають як типовий рівень ознаки в сукупності? Як співвідноситься середня з іншими характеристиками центра розподілу?
4. Середня величина ознаки у двох сукупностях однакова. Чи може бути різною варіація цієї ознаки?
5. Терміни корисного використання нематеріальних активів фірми, захищених патентами, ліцензіями тощо, на кінець року становили:
Термін використання, років
1
2
3
4
5
6
Разом

У % до загальної суми нематеріальних активів
2,6
10,2
39,2
40,0
6,8
1,2
100

Визначіть ряд кумулятивних часток, медіану і моду терміну корисного використання нематеріальних активів фірми.
6. Кредитні ставки комерційних банків під короткострокові позики становили:
Кредитна ставка, %
Суми наданих позик, млн грн.


І квартал
ІІ квартал

До 10
1
5

10 — 20
4
11

20 — 30
9
8

30 і більше
6
6

Разом
20
30

За кожний квартал визначіть середню кредитну ставку та середнє лінійне відхилення. Як змінилися середній рівень і варіація кредитної ставки?
7. Прибутковість активів комерційних банків на початок року становила в середньому 15% при дисперсії 36, на кінець року — 10% при дисперсії 25. Оцініть відносну варіацію прибутковості активів на початок і кінець року, зробіть висновок про напрямок зміни середньої і варіації.
8. Розподіл агропідприємств за рівнем урожайності кукурудзи (ц/га) на зрошувальних землях характеризується даними:
Режим іригації
Середній рівень
Модальне значення
Середнє квадратичне відхилення

1
60
57,0
12

2
75
70,5
9

Порівняйте варіацію та асиметрію розподілу агропідприємств за рівнем урожайності кукурудзи.
9. Квадратичний коефіцієнт варіації витрат домогосподарств на харчування становить 79%. Чи можна вважати однорідною сукупність домогосподарств за цією ознакою?
10. На яких засадах ґрунтується оцінка нерівномірності розподілу? Поясніть зміст і особливості розрахунку коефіцієнтів локалізації та концентрації.
11. За наведеними даними оцініть ступінь концентрації землі у фермерських господарствах, зробіть висновок.
Земельна площа на одне господарство, га
Структура господарств, %


За кількістю ферм
За земельною площею

До 10
8,3
0,3

10 — 50
29,2
4,5

50 — 200
200 — 500
500 — 1000
38,0
20,2
2,7
26,5
23,8
20,6

1000 і більше
1,6
24,3

Разом
100
100

12. За даними про віковий склад парку металообробного устаткування за два роки оцініть інтенсивність структурних зрушень, зробіть висновок.
Вікова група, років
У % до підсумку


1995
2000

До 10
60
45

10 — 20
26
34

20 і більше
14
21

Разом
100
100

13. Частка високоліквідних активів у сумі поточних активів становить 20%. Визначіть дисперсію частки високоліквідних активів.
14. Сукупність розбито на однорідні групи, причому варіація ознаки в групах значно менша, ніж у цілому по сукупності. Який зв’язок між загальною і груповою варіаціями?
15. Яку варіацію характеризує міжгрупова дисперсія?
16. За даними хронометражних обстежень затрати часу на обробку деталі на різних стругальних верстатах становили, хв:
у І зміну — 26, 24, 23, 28, 25, 24;
у ІІ зміну — 28, 30, 29, 33.
Визначіть групові, міжгрупову та загальну дисперсії затрат часу на обробку деталі. Покажіть взаємозв’язок дисперсій.