Лекція 13. Асимптотично нормальні оцінки і надійні інтервали Оцінка називається асимптотично нормальною оцінкою праметра , якщо існує число b> 0, що при великих обсягах вибірки оцінка має розподіл близький до нормального з параметрами : при великих n. Приклад 1. Відносна частота -як оцінка ймовірності є асимптотично нормальною. Доведення. k – має розподіл Бернуллі. . Із ЦГТ випливає, що при великих n розподіл k близький до нормального, отже, розподіл також близький до нормального, а саме, і b треба взяти : . Приклад 2. , як оцінка МХ, якщо DХ - скінченна є асимптотично нормальною, також випливає з центральної граничної теореми, і тоді Приклад 3.Оцінка з відомим мат. сподіванням а, також випливає із ЦГТ, і . Вправа. Довести формули для b у прикладах 2, 3. На жаль, оцінкиідля дисперсії з невідомим математичним сподіванням не є асимптотично нормальними. Надійні інтервали Раніше розглянуті оцінки параметрів називають ще точковими оцінками:. Розглянемо інтервальні оцінки – надійні інтервали. Надійний інтервал параметра – це інтервал () з випадковими (залежними від вибірки кінцями), який містить невідомий параметр з ймовірністю не меншою заданого числа . Це число називають надійністю інтервалу:, де , – функції від вибірки. вибирають близьке до 1: 0,9; 0,99; 0,95. Точність надійного інтервалу – це половина його довжини. Чим точніший інтервал з надійністю , тим кращим він вважається. Але в деяких випадках найкращими вважаються нескінченні надійні інтервали , , вони називаються однобічними, а скінченні – двобічними. Методика побудови надійних інтервалів Часто буває відомий розподіл точкової оцінки(чи деякої функції ), і цей розподіл пов'язаний з невідомим числом (наприклад, як для асимптотично нормальної оцінки). Тоді будують інтервал для розподілу – , такий, що – називатимемо його теж надійним інтервалом для розподілу. Потім внутрішню нерівність розв'язують відносно числа і отримують , тобто – шуканий надійний інтервал для параметра. Роль функції оцінки може грати будь-яка статистика (функція вибірки), для якої відомий розподіл і він пов'язаний з параметром . Отже, треба навчитись будувати надійні інтервали для випадкової величини Х з відомим розподілом. Нехай Х – розподіл з відомою функцією розподілу F(t), чи щільністю розподілу f(t). Потрібно побудувати інтервал , такий, щоб . Згадаємо, що
З малюнків:, , ; S= Отже, двобічний інтервал надійності має вигляд , де будь- які додатні числа, для яких . Розглянемо однобічні інтервали: . Отже, правобічний інтервал надійності має вигляд . Аналогічно для лівобічного інтервалу : . Отже, лівобічний інтервал надійності має вигляд . Розглянемо особливості надійних інтервалів для стандартного нормального розподілу N(0;1). Так як, нормальний розподіл Y дуже поширений, і він виражається через стандартний:і навпаки , то для побудови надійного інтервалу для нормального розподілу можна побудувати його для стандартного нормального, а потім розв'язати нерівність. Для стандартного нормального розподілу N(0;1) квантилі позначаються. ?, де – таблична функція Лапласа (нагадаємо, що її табличні значення лежать в проміжку [0; 0,5] ). ?. Оскільки, – непарна функція, то отримуємо, що . Отже, двобічний інтервал надійності для розподілу N(0;1) має вигляд , або , де будь- які додатні числа, для яких і квантилі =t шукаємо з допомогою табличної функції Лапласа навпаки, прирівнюючи . Цей надійний інтервал буде найточнішим (найкоротшим), коли . Це видно із симетрії щільності N(0;1). : ? . Отже, найточніший надійний інтервал надійності для розподілу N(0;1) має вигляд , де квантиль=t знаходять з табл.ф.Лапласа навпаки, прирівнюючи Однобічні інтервали: i чи . Надійні інтервали із асимптотично нормальних оцінок Із асимптотично нормальних оцінокпри великих обсягах вибірки n можна побудувати надійний інтервал для, оскільки ми знаємо їх розподіл, який пов'язаний з числом . , то і інтервал надійності для останньої в.в. має вигляд , тобто, . Зробимо прості перетворення у внутрішній нерівності, щоб виразити : , тобто для параметра отримали інтервал надійності : , де будь- які додатні числа, для яких і квантилі =t шукаємо з допомогою табличної функції Лапласа навпаки, прирівнюючи . Найточніший надійний інтервал: , де квантиль =t знаходять в таблиці Лапласа навпаки, прирівнюючи . Однобічні інтервали (i):,. Приклади надійних інтервалів 1. Для MX, якщо DX<+?. – aсимптотична нормальна оцінка, b=, при відомій , або , чи, якщо - невідома, а вибірка велика . Маємо найточніший надійний інтервал надійності : Аналогічно для ймовірності події:при n>500: . Якщо , то можна брати максимально можливе b=0,5 (легко довести, що , де 0<p<1). 3. Надійні інтервали для параметрів нормального розподілу Надійні інтервали для параметрів нормального розподілу можна використовувати при довільних обсягах вибірок, не обов’язково великих. Нормальний розподіл позначаємо і його параметри . а) Для а при відомому . – тобто, – не тільки асимптотично нормальна оцінка, а, навіть, просто нормальна оцінка, така, що завжди має нормальний розподіл, навіть при малих n. Співставимо з . – найточніший інтервал надійностідля а. б) Для дисперсії при відомому а. , тоді має розподіл із n ступенями вільності. Квантилірозподілу із n ступенями вільності позначаються, для них складені таблиці. Тоді, правобічний інтервал надійності має вигляд для даного розподілу, тобто, ??=, де , і надійний інтервал для має вигляд:[) –це однобічний інтервал. Аналогічно інший однобічний інтервал: [). Для двобічного беруть : - розподіл не симетричний, то найточніші інтервали шукають методом підбору. в) Для при невідомому а. Можна довести, що статистика має розподіл із n-1 ступенями вільності. Тоді маємо такі інтервали:[),[),. г) Надійні інтервали для а при невідомому . Можна довести, що має t-розподіл Стьюдента із n-1 ступенями вільності. Маємо надійні інтервали: (враховано, що розподіл Стьюдента симетричний відносно точки 0, з модою 0, як і стандартний нормальний розподіл). При n>120 заміняють квантилі розподілу Стьюдента t на квантилі стандартного нормального розподілу u. Приклад. Побудувати інтервал надійності 0,92 для середнього значення тривалості роботи кінескопа, якщо спостереження за роботою 400 телевізорів дали такі результати: =10 років 218 днів, = 613 днів. Тривалість роботи кінескопа – нормальний розподіл, бо на нього впливають багато незалежних факторів (ЦГТ). Але n=400 – дуже велике, то використаємо все ж таки квантилі стандартного нормального розподілу u. : =0,46. Маємо з таблиці Лапласа навпаки t=1,75 і найточніший надійний інтервал: . Після обрахунків: (10р.164д.; 10р.272д.).