РОЗДІЛ 4
ЕЛЕМЕНТИ МАТЕМАТИЧНОЇ СТАТИСТИКИ
ОСНОВНІ ПОНЯТТЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ
Математична статистика – це розділ математики, який займається методами збору, аналізу і обробки статистичних даних.
Статистичні дані – це сукупність числових результатів, отриманих дослідженням великої кількості об’єктів або явищ.
Сучасна математична статистика поділяється на дві області: описову і аналітичну статистику.
Перша з них охоплює методи опису статистичних даних, подання їх у формі таблиць, діаграм і т.д.
Аналітична статистика ще називається теорією статистичних висновків. Її предметом є обробка даних і формулювання висновків.
Група предметів, об’єднаних певною ознакою або властивістю називається статистичною сукупністю.
Вся множина досліджуваних числових результатів називається генеральною сукупністю, її підмножина – вибіркою з генеральної сукупності або просто вибіркою. Кількість елементів генеральної сукупності називається об’ємом генеральної сукупності, кількість елементів її підмножини – об’ємом вибірки.
Надалі під вибіркою об’єму будемо розуміти -вимірний випадковий вектор елементи якого є незалежними і однаково розподіленими. Множина значень, яку може набувати кожна з компонент, буде генеральною сукупністю, а вимірний числовий вектор кожна з компонент якого є елементом генеральної сукупності, будемо називати реалізацією вибірки.
СТАТИСТИЧНИЙ І ВАРІАЦІЙНИЙ РЯД
Розглядаємо реалізацію вибірки Різні значення реалізації будемо називати варіантами. Нехай варіанта зустрічається разів, варіанта разів, ..., разів. Значення називаються частотами.
Означення. Статистичним рядом або статистичним розподілом вибірки називається послідовність пар .
Звичайно статистичний ряд подається у вигляді таблиці, перша стрічка якої містить елементи , друга –



...





...



Очевидно, що
.
Відносною частотою появи варіанти називається відношення і позначається Нескладно переконатись, що
.
Статистичним рядом відносних частот називається набір пар
Елементи реалізації вибірки, записані в порядку неспадання, називаються варіаційним рядом і позначаються Якщо зустрічаються рівні між собою елементи, то вони нумеруються у довільному порядку. Ця дія називається ранжуванням даних.
Величина називається розмахом вибірки.
Якщо кількість варіант є достатньо великою, то елементи вибірки об’єднують у групи і подають у вигляді згрупованого статистичного ряду. Для цього інтервал, який містить всі елементи реалізації, розбивається на інтервалів, які не перетинаються. Обчислення значно спрощуються, якщо всі часткові інтервали мають однакову довжину (Надалі ми будемо розглядати лише інтервали однакової довжини). Частоти – кількість елементів реалізації вибірки, які потратили в -й інтервал. При цьому отриманий статистичний ряд можна записувати двома способами:
а) у верхній стрічці середина -го інтервалу у нижній –
б) у верхній – межі -го інтервалу, у нижній –
У літературі елементи, які знаходяться на краях інтервалу, можуть записуватись або у лівий інтервал, або у правий інтервал, або по 0.5 додається до частот, які знаходяться зліва і справа.
Аналогічно утворюється згрупований статистичний ряд відносних частот.
В залежності від об’єму вибірки кількість інтервалів береться від 6 до 20 або підраховується за однією з формул , , .
Очевидно, що

де
Поряд з частотами одночасно підраховуються і нагромаджені частоти і нагромаджені відносні частоти .
Слід зауважити, що групування вибірки вносить похибку у подальші обчислення, яка зростає із зменшенням кількості інтервалів.
ПОЛІГОН І ГІСТОГРАМА
Означення. Полігоном частот вибірки (згрупованої вибірки) називається ламана у декартовій системі координат з вершинами .
Означення. Полігоном відносних частот вибірки (згрупованої вибірки) називається ламана у декартовій системі координат з вершинами  .
Означення. Гістограмою частот (відносних частот) називається ступінчаста фігура, складена з прямокутників, побудованих на інтервалах групування. Висота -го прямокутника дорівнює , де – ширина -го проміжку .
Площа прямокутників для гістограми частот дорівнює
, .
Аналогічно, сума площ прямокутників для гістограми відносних частот дорівнює
.
Означення. Полігоном нагромаджених частот згрупованої вибірки називається ламана з вершинами в точках
Аналогічно дається означення полігона нагромаджених відносних частот, тільки заміняється на
ЕМПІРИЧНА ФУНКЦІЯ РОЗПОДІЛУ
Емпірична функція розподілу визначається аналогічно, як і функція розподілу для дискретної випадкової величини, тільки значення замінюються
Означення. Емпіричною функцією розподілу для реалізації вибірки називається функція
Означення. Нехай Вибірковою квантиллю порядку називається абсциса точки, що лежить на графіку емпіричної функції розподілу і має ординату
Порядок квантилі визначає частку загальної кількості спостережень у вибірці, результати яких не перевищують Значення порядку часто подають у процентах.
ПРИКЛАДИ
Приклад 1. Дано реалізацію вибірки
–5, 4, 1, 3, 5, 4, 1, 5, –5, 4,
4, 1, 1, 5, 4, 5, 1, 4, 3, 1,
1, 1, 4, 4, 3, –5, 1, 4, 5, 1,
4, 4, 4, 1, 1, –5, 1, 3, 4, 1,
4, 4, 1, 1, 4, –5, 1, 4, 3, 1.
Записати статистичний і варіаційний ряд. Знайти емпіричну функцію розподілу, полігон частот.
Розв’язування. Об’єм вибірки дорівнює 50.
Варіантами для даної реалізації будуть значення –5, 4, 1, 3, 5. Підрахуємо відповідні частоти.
,
,
,
,
.
Перевірка:
Статистичний ряд частот

–5
1
3
4
5


5
18
5
17
5


Обчислюємо відносні частоти

Статистичний ряд відносних частот:

–5
1
3
4
5


0.1
0.36
0.1
0.34
0.1


Варіаційний ряд
–5, –5, –5, –5, –5, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4,
5, 5, 5, 5, 5.
Емпірична функція розподілу:

Графік емпіричної функції розподілу

Полігон частот

Приклад 2. Річний прибуток 50 підприємств становить
17 21 8 20 23 18 22 20 15 27
17 12 20 11 9 19 20 9 8 19
17 21 13 17 22 22 10 20 21 30
15 19 20 20 13 21 21 9 14 11
19 18 23 19 17 14 25 18 19 9.
Знайти розмах вибірки, кількість і довжину інтервалів, побудувати гістограму, записати згрупований статистичний ряд.
Розв’язування. Насамперед знайдемо роз