§13. Поняття про статистичну перевірку гіпотез і критерії згоди.
1. Статистична перевірка гіпотез
Статистичною називають гіпотезу про вигляд невідомого закону розподілу або про параметри відомих розподілів. Наприклад, статистичними є гіпотези
генеральна сукупність розподілена за біномним законом, або
дисперсії двох нормальних сукупностей рівні між собою, тощо.
Гіпотезу, яку висуваємо, назвемо нульовою, або основною, позначимо . Конкуруюча, або альтернативна - це гіпотеза, яка суперечить висунутій, позначимо .
Наприклад, якщо нульова гіпотеза : генеральна сукупність розподілена за нормальним законом, то альтернативна їй гіпотеза : ця сукупність не розподілена нормально.
Гіпотези поділяють на прості і складні.
Проста гіпотеза містить тільки одне припущення.
Складна гіпотеза складається із скінченного або нескінченного числа простих гіпотез.
Наприклад, якщо – параметр розподілу Пуассона, то гіпотеза : =3 є простою гіпотезою;
а гіпотеза : - це складна гіпотеза.
Нехай маємо дві прості гіпотези і . Ці гіпотези конкурують одна з одною і потрібно, на основі певних спостережень, визначити, якій з них ми надаємо перевагу. При цьому ми можемо зробити помилки першого або другого роду.
Помилка першого роду - висунута гіпотеза в дійсності є вірною, а ми її відхиляємо;
помилка другого роду - висунута гіпотеза хибна, а ми її приймаємо.
Ймовірність зробити помилку першого роду позначають і називають рівнем значущості. Значення приймають рівним 0,05; 0,01; 0,001. Наприклад, якщо прийнято =0,05, то це означає, що в 5% випадків є ризик припуститися помилки першого роду, тобто відхилити правильну гіпотезу.
Для перевірки основної гіпотези використовують спеціально підібрану випадкову величину, точне або наближене значення якої відоме. Назвемо її статистичним критерієм і позначимо .
Спостережуваним значенням називають значення критерія, яке обчислюють за даними вибірки.
Після вибору певного критерію множину всіх його можливих значень розбивають на дві підмножини і , які не перетинаються. Підмножина - область прийняття основної гіпотези, або область допустимих значень , містить ті значення критерія, при яких основна гіпотеза приймається, а підмножина - критична область стосовно основної гіпотези , містить ті значення критерія, при яких основна гіпотеза відхиляється, тобто приймається конкуруюча гіпотеза.
Основний принцип перевірки статистичних гіпотез можна сформулювати таким чином: якщо спостережуване значення критерія належить критичній області, то основну гіпотезу відхиляють; якщо належить області допустимих значень, то гіпотезу приймають.
Процес перевірки, який веде до підтвердження чи заперечення висунутої гіпотези, є деяким правилом, і вибір цього правила еквівалентний вибору критичної області.
Критичними точками називають точки, які відділяють критичну область від області прийняття гіпотези.
Критична область буває однобічна:
правобічна, яка визначається нерівністю , (1)
і лівобічна, яка визначається нерівністю (2)
або двобічна, яка визначається нерівностями (). (3)
Якщо критичні точки симетричні відносно нуля, то двобічна критична область визначається нерівностями  (4)
Розглянемо питання про знаходження правобічної критичної області .
Задаємо достатньо малу ймовірність - рівень значущості. Критичну точку знаходимо з умови , (5)
тобто, якщо справедлива основна гіпотеза, то ймовірність того, що критерій прийме значення, більше , дорівнюватиме заданому рівню значущості.
Для кожного критерія є відповідні таблиці, і за ними знаходять критичну точку, яка задовольняє умову (5).
Коли знайдена, то за даними вибірки обчислюють спостережуване значення критерію . Якщо , то основну гіпотезу приймають; якщо ж , то основну гіпотезу відхиляють.
Аналогічно знаходять лівобічну критичну область з умови
. (6)
Критичні точки двобічної критичної області знаходять з умови
. (7)
Якщо розподіл критерія симетричний відносно нуля, то = і критичну точку знаходимо з умови =. (8)
1.1. Задача про порівняння двох дисперсій нормальних генеральних сукупностей.
На практиці ця задача виникає при порівнянні точності приладів, самих методів вимірювань, тощо. Звичайно, є кращим прилад, метод, при користуванні яким розсіювання (дисперсія) результатів є меншою.
Отже, нехай генеральні сукупності ознак і розподілені нормально. З двох незалежних вибірок обсягами і обчислені “виправлені” вибіркові дисперсії . Потрібно при даному значенні перевірити основну гіпотезу про рівність генеральних дисперсій
. (9)
Або враховуючи, що “виправлені” вибіркові дисперсії є незміщеними оцінками генеральних дисперсій
.
основну гіпотезу можна записати так
. (10)
Виникає питання: суттєво чи несуттєво відрізняються “виправлені” дисперсії?
Якщо виявиться, що гіпотеза справедлива, тобто генеральні дисперсії однакові, то різниця “виправлених” дисперсій несуттєва і пояснюється випадковими причинами.
За критерій перевірки нульової гіпотези приймаємо відношення більшої “виправленої” дисперсії до меншої , тобто випадкову величину
. (11)
Величина має розподіл Фішера-Снедекора із степенями вільності і ,
де - обсяг вибірки, за якою обчислена більша “виправлена” дисперсія, - обсяг вибірки, за якою обчислена менша “виправлена” дисперсія. Розподіл Фішера-Снедекора визначається тільки двома параметрами – степенями вільності і . Значення величини табульовані.
Критична область будується в залежності від виду конкуруючої гіпотези.
Випадок І. Нульова гіпотеза . Конкуруюча гіпотеза . (12)
В цьому випадку будуємо правобічну критичну область , яка задовольняє умову
. (13)
Критичну точку знаходимо за таблицею критичних точок розподілу Фішера-Снедекора. Значення обчислюємо за формулою (11).
Якщо , то немає підстав відхиляти нульову (основну) гіпотезу, якщо то нульову гіпотезу відхиляємо.
Приклад. За даними двох незалежних вибірок обсягів знайдено