§11. Елементи математичної статистики. Основні поняття. Статистичні
оцінки параметрів розподілу. Точкові оцінки характеристик.
Математичною статистикою називається наука, яка займається розробкою методів відбору, опису і аналізу дослідних даних з метою вивчення закономірностей випадкових масових явищ.
В свою чергу, встановлення цих закономірностей базується на вивченні методами теорії ймовірностей статистичних даних – результатів досліду або спостережень.
Найбільш важливі задачі математичної статистики можна умовно розділити на дві групи:
перша група – вказати способи відбору і групування статистичних даних;
друга група – розробити методи аналізу статистичних даних в залежності від мети дослідження.
До другої групи відносяться такі задачі:
а) Оцінка невідомої функції розподілу; - в результаті незалежних спроб (вимірів) над випадковою величиною одержані її значення . Потрібно наближено оцінити невідому функцію розподілу випадкової величини .
б) Оцінка невідомих параметрів розподілу: - випадкова величина має функцію розподілу певного типу, яка залежить від параметрів, значення яких невідомі. Потрібно на основі дослідних даних оцінити значення цих параметрів.
в) Статистична перевірка гіпотез: - на основі певних міркувань можна вважати, що є функцією розподілу досліджуваної випадкової величини . Потрібно встановити, чи сумісні ці спостережувані значення з гіпотезою, що випадкова величина дійсно має розподіл .
1. Основні поняття.
Нехай потрібно дослідити яку-небудь ознаку, характерну великій групі однотипних елементів (наприклад, міцність зразків сплаву, відхилення розмірів виготовлених деталей від номінального розміру, тощо).
Сукупність значень ознаки всіх елементів даного типу називається генеральною сукупністю.
Число може бути скінченним або нескінченним.
Звичайно, на практиці неможливо, або й економічно невигідно обстежити всю генеральну сукупність. Тоді із всієї сукупності елементів випадковим чином вибирають обмежену кількість елементів, які і вивчають.
Вибірковою сукупністю або вибіркою називається сукупність випадково відібраних елементів.
Вибірковий метод полягає в тому, що з генеральної сукупності обсягу береться вибірка обсягу , де і визначаються характеристики вибірки, які приймаються за наближене значення відповідних характеристик генеральної сукупності.
1.1. Статистичний розподіл вибірки
Нехай в результаті проведення досліду з генеральної сукупності зроблена вибірка обсягу . Вважаємо, що ознака - дискретна випадкова величниа, причому значення спостерігалось разів, тобто спостерігалось разів, - разів, …, - разів, і (обсягу вибірки).
Значення називають варіантами, а послідовність варіант, розташованих в порядку зростання – варіаційним рядом. Числа спостережень називають частотами, а відношення цих чисел до обсягу вибірки - відносними частотами. Результати досліду зручно представити у вигляді таблиці частот














або таблиці відносних частот















Якщо ознака - неперервна випадкова величина, то користуються інтервальними таблицями частот














При цьому весь діапазон зміни варіант від = до = розбивають на 10-20 частинних інтервалів з межами , ,…, і підраховують частоту попадання в -й частинний інтервал. Аналогічно будується інтервальна таблиця відносних частот.
Сукупність значень варіант і відповідних їм частот (або відносних частот) називають статистичним розподілом вибірки.
Приклад 1. Задано розподіл вибірки .
Записати розподіл відносних частот.
Розв’язання. Обсяг вибірки .
Шуканий розподіл відносних частот має вигляд

або остаточно

Варто зауважити, що в теорії ймовірностей під розподілом розуміємо відповідність між можливими значеннями випадкової величини і їх ймовірностями, а в математичній статистиці під розподілом розуміємо відповідність між спостережуваними значеннями (варіантами) і їх частотами (або відносними частотами).
1.2. Полігон і гістограма.
Часто для наочності будують різні графіки статистичного розподілу.
Полігон частот – це ламана лінія, відрізки якої з’єднують точки .
Полігон відносних частот – це теж ламана лінія, відрізки якої з’єднують точки , де - обсяг вибірки.
Якщо ознака неперервна, то будують гістограму. При цьому інтервал, в якому лежать всі спостережувані значення ознаки, розбивають на декілька частинних інтервалів однакової довжини кожен і знаходять для кожного частинного інтервалу - суму частот варіант, що попали в -ий інтервал.
Гістограма частот – це ступінчата фігура, складена із прямокутників, основами яких є частинні інтервали довжини , а висоти дорівнюють - щільність частоти. Тоді площа -го прямокутника дорівнює , а площа всієї гістограми частот дорівнює - обсягу вибірки.
Іноді будують гістограму відносних частот, в цьому випадку висота -го прямокутника дорівнює , площа гістограми відносних частот дорівнює одиниці.
Приклад 2. Задано розподіл вибірки обсягу .
Частинні інтервали довжини
Сума частот варіант частинного інтервала

Щільність частоти


1-3
2
1

3-5
3
1,5

5-7
20
10

7-9
40
20

9-11
28
14

11-13
4
2

13-15
3
1,5






Побудувати гістограму частот.
1.3. Емпірична функція розподілу.
Нехай маємо статистичний розподіл вибірки обсягу . Позначимо - кількість спостережень, при яких спостерігали значення ознаки менше числа . Відносна частота події буде . Із зміною змінюється і відносна частота, тобто відносна частота є функцією від .
Функцією розподілу вибірки називають функцію , яка визначає для кожного значення відносну частоту події : =, (1)
де - число варіант, менших .
Її ще називають емпіричною функцією розподілу, оскільки вона шукається емпіричним (дослідним) шляхом.
Функцію розподілу генеральної сукупності називають теоретичною функцією розподілу.
Теоретична функція розподілу визначає ймовірність події , а емпірична функція - відносну частоту цієї події.
Із закону великих чисел, зокрема з теореми Бернуллі, випливає, що відносна частота події збігається за ймовірністю до ймовірності цієї події, тобто
Іншими словами, для великих значень емпірична функція розподілу наближено представляє теоретичну функцію розподілу генеральної сукупності.