Лекція №7
Приклади розподілів випадкових величин
План
Рівномірний розподіл
Стандартний нормальний розподіл
Нормальний розподіл
Властивості нормальних розподілів. Центральна гранична теорема
Розподіли - Пірсона, t-Стьюдента, F-Фішера-Снєдокора
Показниковий розподіл
Біноміальний розподіл
Розподіл Пуассона. Найпростіший потік
Гіпергеометричний розподіл
Геометричний розподіл
Д.з.: 085-116: 518, 523, 528, 531, 533, 534, 549, 550, 552, 584, 585, 586, 589-591, 596-598
Рівномірний розподіл
Рівномірний розподіл на відрізку [a, b] (чи з параметрами a, b) – це абсолютно неперервна випадкова величина з такою щільністю:
f(x)=
Відшукаємо константу з умови

Звідки const=1/(b-a). Отже,
f(x)=
f

1/(b-a)


a b x
Відшукаємо функцію рівномірного розподілу за формулою F(x)=
Якщо x<0, то F(x) = ,
при , F(x)= – рівняння прямої,
при x>b, F(x)=1.
Отже, F(x)= 1 y=F(x)

a b x
Обчислимо числові характеристики рівномірного розподілу.
Із механічного змісту математичного сподівання та дисперсії, якщо Х – рівномірно розподілена на [a;b], то
MX= , DX=.
Вправа. Перевірити формули за означенням.
Оскільки, рівномірний розподіл симетричний, то AsX=0, MeX= .
Неважко підрахувати, що ExX=-1,2 . Немає МоX.
Розглянемо приклади випадкових величин, що мають рівномірний розподіл:
При регулярному русі транспорту час очікування його рівномірно розподілений на відрізку [0, T], де Т – проміжок часу між двома прибуттями транспорту на зупинку.
Момент приходу корабля у порт можна вважати рівномірно розподіленим на протязі доби, якщо корабель плив здалеку.
Іноді розподіл вважають рівномірним на відрізку, якщо відомо, що він зосереджений на відрізку, а жодної іншої інформації про цей розподіл немає.
Похибки заокруглення з точністю до 10 - n - рівномірно розподілені на відрізку
[-0,5*10-n ;0,5*10-n].
Рулетка -- рівномірний розподіл від 0° до 360°.
Стандартний нормальний розподіл
Кажуть, що випадкова величина має стандартний нормальний розподіл, якщо її щільність дорівнює: f(x)=?(x)=.
Стандартний нормальний розподіл позначається N(0,1).
?(x)


-1 1 х
Відомо що, . Отже, ця функція дійсно є щільністю.
Як ви знаєте, для функції Лапласа Ф(х)= складені таблиці. Функція розподілу N(0,1) пов'язана з функцією Лапласа співвідношенням
F(x)=.
Треба пам’ятати, що функція Лапласа непарна: Ф(-х)=-Ф(х).
Ф
1/2

х
-1/2
F

1
1/2
F
0 x
Тоді P(a<Х<b)=F(b)-F(a)=1/2+Ф(b)-1/2-Ф(а)=Ф(b)-Ф(а).
Обчислимо числові характеристики стандартного нормального розподілу.
З геометричної точки зору, оскільки щільність симетрична відносно нуля то MX=0.
==.
(Тут використано, що.)
Тоді, DX=MX2-(MX)2=1-02=1.
Розподіл одновершинний, симетричний, тому МоХ=0, МеХ=0, АsX=0. Отже, і МХ3=0
Обчислимо m4 = МХ4
==
(Тут аналогічно як при обчисленні MX2 неважко довести, що .)
Тоді
Тут можна пояснити походження формули для ексцесу. Віднімають трійку, щоб порівнювати ексцеси випадкових величин з ексцесом нормального розподілу, а з нулем зручніше порівнювати.
Впрапва. Подумати чи правильно: якщо Х~N(0,1), то і -Х~N(0,1).
Нормальний розподіл N(a, ?2) Гауса, Лапласа
Випадкова величина Y називається нормально розподіленою з параметрами a, ? 2, якщо
Y= a+ ?X, де X – вип. величина , що має стандартний нормальний розподіл.( .)
Скорочений запис: Y~N(a, ? 2), якщо Y= a+ ?X , де Х~N(0,1).
Оскільки при Х~N(0,1), також і -Х~N(0,1), то можна вважати ? >0.
Знайдемо числові характеристики нормального розподілу, використавши властивості математичного сподівання та дисперсії: МY= a+ ?МХ=а, DY =D(?X)= ? 2DX= ? 2, =? .
Отже, параметри нормального розподілу – це його математичне сподівання (середнє значення) та дисперсія: a=MX, ? =.
Знайдемо функцію нормального розподілу Y, врахувавши те, що функція стандартного нормального розподілу Х нам відома Fx(t)=1/2 +Ф(t).

Знайдемо щільність нормального розподілу
=
f

а-3? а-? а а+? а+3? t
Нормальний розподіл – симетричний, тому AsY=0, MoY=a, MеY=a, MY=a.
Обчислимо .
Тоді Отже, ExY==0
Таким чином, асиметрія й ексцес будь-якого нормального розподілу a не тільки стандартного дорівнюють нулю.
Обчислимо ймовірність попадання нормального розподілу в заданий проміжок: .
Обчислимо ймовірність відхилення Y від середнього значення не більше ніж на задане число .
Якщо = 3?, то Р=2Ф(3)==. То ймовірність протилежної події приблизно дорівнює нулю. Ми отримали правило трьох сігм (?), згідно якого ймовірність відхилення нормально розподіленої випадкової величини від свого середнього значення більше ніж на 3? приблизно дорівнює нулю.
Властивості нормальних розподілів
1.Клас нормальних розподілів інваріантний відносно лінійних замін випадкової величини, тобто, якщо Х – нормальний розподіл, то сХ+d – також нормальний, при с (Очевидно, якщо врахувати, що Х=? Z+a, де Z~N(0,1). )
2.Якщо Х1,Х2,…,Хn – нормальні розподіли, то Х1+Х2+…+Хn – також нормальний розподіл, якщо не вийде сталий розподіл (без доведення).
Центральна гранична теорема Ляпунова
Нехай Х1,Х2,…,Хn, … – незалежні випадкові величини,
існують їх скінченні моменти: МXk=ak, DXk=dk,
Розглянемо їхню суму, випадкову величину Sn = Х1+Х2+…+Хn. Позначимо: a1+a2+…an=An, (це будуть МSn і ? Sn відповідно),
Якщо , то при великих n розподіл Sn дуже близький до нормального, тобто, для всіх t є R . (1)
Оцінку швидкості збіжності дає формула:для всіх t є R.
Із центральної граничної теореми випливає поширеність нормального розподілу у природі. На випадкову величину, що зустрічається на практиці іноді впливає велика кількість мало залежних причин, кожна з яких вносить невеликий вклад у цю випадкову величину, тоді, за центральною граничною теоремою її розподіл має бути близьким до нормального.
Із ЦГТ випливає також наближені локальна та інтегральна формули Лапласа.
Приклади нормальних розподілів. Дуже поширений у природі та на практиці: похибки експери-ментів, маса чи розміри виробу, ріст людини, відхилення снаряда від точки прицілювання і т.д.
Для математичної статистики важливою є теорема – ЦГТ для незалежних однаково розподілених величин: якщо випадкові величини – незалежні та однаково розподілені, мають скінченне математичне сподівання та дисперсію, то їх сумарна випадкова величина має розподіл близький до нормального і виконується формула 1.
Доведення., , , , то для їх сумарної випадкової величини , , , =,
i тоді , , тобто виконується умова ЦГТ.
Задача. Середня маса яблук у ящику 25 кг, середнє квадратичне відхилення 2 кг. Яка ймовірність того, що: 1) маса яблук у 100 ящиках буде менша 2450 кг, 2) маса яблук у 100 ящиках відхилиться від середньої маси не більше, ніж на 200 кг?
Позначимо– маса першого ящ.,...,– маса сотого ящика, S – маса 100 ящиків.
Тоді S = , = 25 кг, ==4
MS==2500 кг, DS = (незалежні), =20.
Тоді за ЦГТ розподіл S має бути близький до нормального S~N (2500;400).

2), оскільки Ф(5)=0,4999997.
В статистиці зустрічаються інші розподіли, які будуються з допомогою нормального.
Розподіл - Пірсона
– незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл ~N (0; 1). Y = .
Тоді кажуть, що Y має розподіл із n ступенями вільності.
Для цього розподілу складені таблиці.
Обчислимо числові характеристики розподілу Пірсона:
МY = ,
DY = = n(3-1) = 2n.
Якщо ступенів вільності багато (n>20), то, згідно з ЦГТ, розподіл Пірсона близький до нормального N(n, 2n). Тому таблиці складені тільки до n=20.
Очевидно, що якщо випадкові величини Y та Z незалежні і мають розподіли з n та m ступенями вільності, то Y+Z також має розподіл з n+m ступенями вільності.
t – розподіл Стьюдента
– незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл ~N (0; 1).
t =X/
Тоді кажуть, що t має t-розподіл Стьюдента із n ступенями вільності. Для цього розподілу складені таблиці.
F – розподіл Фішера-Снєдокора
–незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл N (0; 1): F =
Тоді кажуть, що F має F-розподіл із (n,m) ступенями вільності. Для цього розподілу складені таблиці.
Показниковий розподіл
Випадкова величина називається показниково розподіленою з параметром ?>??якщо її функція розподілу має вигляд
0, t<0, 1 y=F(x)
F (t) = 1-, t??????????????????????????????????????????????????????????????????????????????????????????????????????
????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????x?
Знайдемо щільність
0, t<0, ???????????????????????????y=f(x)
f (t)=F'(t)= , t???????????????????????????????????????????????????????????????????????????????????????????????x??
Теорема: показниковий розподіл описує тривалість існування нестаріючих елементів, тобто, якщо елемент проіснував час t, то ймовірність того, що він проіснує ще час така ж як і для нового елемента.
Доведення. Для нового елемента: ==.
Для старого елемента -- використаємо формулу.
====.
Приклади показникових розподілів: нестаріючими є радіоактивні елементи, тривалість телефонної розмови, проміжок часу між двома однотипними послідовними подіями (замовленнями, викликами).
Обчислимо числові характеристики показникового розподілу:
====1/??
Тут використано, що .
Аналогічно неважко обчислюється . Тоді , .
МоХ = 0. Знайдемо медіану, розв'язавши рівняння F(T)=1/2: 1-=1/2,=1/2, =2,
звідки MeX=ln2/??. Показниковий розподіл має правосторонню асиметрію, оскільки MX>MeX>MoX (1/??> ln2/? > 0 ), AsX=2.
Вправа. Перевірити, що AsX=2.
Приклади дискретних випадкових величин. Біноміальний розподіл (Бернуллі)
Такий розподіл має випадкова величина Х – кількість успіхів у n незалежних випробуваннях, (або якщо розглядається n незалежних подій з однаковими ймовірностями p, то Х – кількість подій, що сталися). Можливі значення: 0, 1, 2, 3, ..., n. Ймовірність кожного значення обчислюється за формулою Бернуллі:,, де p – ймовірність успіху, q – ймовірність промаху(q=1-p). Отже, параметрами біноміального розподілу є два числа n i p.
Х
0
1
...
n

Р


...


(використано формулу бінома Ньютона).
Отже, це справді закон розподілу.
Складені таблиці для біноміального розподілу, а саме дляі дляпри різних n, p,.
Обчислимо числові характеристики біноміального розподілу. Для цього позначимо випадкові величини – кількість успіхів у першому випробуванні, – кількість успіхів у другому випробуванні, ..., – кількість успіхів в n -тому випробуванні. ,,..., – дискретні незалежні випадкові величини з однаковим розподілом (законом розподілу):

0
1

Р
q
p

i=1,2,..., n.
, , =p(1-p)=pq.
Тоді початкова випадкова величина Х= і
MX==np, DX=(незал.)==npq, .
Обчислимо моду.
Теорема. МоХ=[pn+p] , якщо pn+p не є цілим числом ([pn+p] ціла частина числа pn+p).
Доведення. Подивимось, коли більше чи рівне:
?1, що рівносильне ()
p(n-k)?q(k+1) . Отже, приймовірності зростають, а при спадають.
Тому: 1) Якщо = pn-q ціле число, то =pn-q+1=pn+p також ціле і , тобто i найбільш імовірні значення з однаковими ймовірностями і моди немає.
Якщо ж pn-q не є цілим, то значення k=[pn-q+1]=[np+p] є найбільш імовірним значенням.
Зауваження. Якщо np-ціле, то згідно теореми воно і буде модою, тобто тоді Мо=МХ=np.
Задача. Для кожного з чотирьох працівників ймовірність отримати виклик протягом зміни дорів-нює 0,6. Знайти закон розподілу кількості працівників, що отримають виклик протягом зміни, обчислити її математичне сподівання, дисперсію та середнє квадратичне відхилення.
Х – к-cть працівників, що отримають виклик протягом зміни – біноміальний розподіл з n=4, p=0,6.



Х
0
1
2
3
4

Р
0.0256
0.1536
0.3456
0.1536
0.1296

MX=np==2,4 DX=npq==0,96 .
Оскільки біноміальний розподіл можна представити у вигляді суми n незалежних однакових розподілів (так як при обчисленні числових характеристик), то із ЦГТ для однакових розподілів випливає, що при великих n біноміальний розподіл близький до нормального, а саме до
N(np, npq). Звідси отримуємо наближені локальну та інтегральну формули Лапласа.
Розподіл Пуассона
Такий розподіл має випадкова величина, яка набуває значень 0, 1, 2, 3, ... і
k=0, 1, 2, 3, ..., де – параметр, .
. Отже, це дійсно закон розподілу.
Розподіл Пуассона описує рідкісні події. Він є граничним розподілом для біноміального, якщо p мале, а n велике. (Згадаємо формулу Пуассона.) Складені таблиці для розподілу Пуассона, а саме для i дляпри різних , k і .
Знайдемо числові характеристики розподілу Пуассона :
MX=.

==,
DX=.
Найпростіший потік
Нехай час від часу відбуваються випадкові події певного типу, наприклад, телефонні виклики, автомобільні аварії і т. п. Послідовність моментів настання таких подій називається випадковим потоком.
Означення. Потік називається найпростішим, якщо виконуються умови:
кількості подій, які відбудуться на несумісних інтервалах часу незалежні;
ймовірність настання в нескінченно малий проміжок часу () двох і більше подій можна вважати нулем.
Теорема 1. Якщо потік найпростіший, то кількість подій, що відбудеться в даному інтервалі часу, має розподіл Пуассона (без доведення).
Нехай відомо, що в інтервалі часу довжиною h в середньому відбувається N подій. N може бути не цілим, воно і буде параметром розподілу Пуассона Х – кількості подій в інтервалі часу довжиною h. Тоді в інтервалі часу довжиною kh в середньому відбувається kN подій, і відповідно змінюється параметр (Y – кількість подій в інтервалі часу kh, – кількості подій в послідовних інтервалах часу довжинами h, з яких складається інтервал kh. , то ).
Теорема 2. Якщо потік найпростіший, то інтервали часу між послідовними подіями незалежні, однаково розподілені і мають показниковий розподіл з однаковим параметром (без дов.).
Позначимо цей показниковий розподіл Y. В тій ж ситуації, якщо відомо, що в інтервалі часу довжиною h в середньому відбувається N подій, то середній інтервал між послідовними подіями h/N. Для показникового розподілу середнє значення МY=1/, то =N/h.
Задача. На склад надходить у середньому 2 замовлення за день. Яка ймовірність того, що за наступні три дні: 1)не буде жодного замовлення, 2)буде більше двох замовлень, 3)буде більше 10 замовлень? Знайти середній проміжок часу між двома замовленнями. Потік замовлень вважати найпростішим.
Х – кількість замовлень за 3 дні – розподіл Пуассона.
За 3 дні в середньому буде 6 замовлень (), тобто МХ==6.
1) P(X=0) ==.
2) P(X>2)=1 -.
3) P(X>10) =? (знаходимо в таблицях розподілу Пуассона) ? 0,044.
Середній проміжок часу між замовленнями h/N=(1день)/2=1/2 (дня) – половина дня.
Зауваження. Розподіл Пуассона розглядають також і у випадку, коли рідкісні точки розподіляються на площині чи в об'ємі. Наприклад, кількість родзинок в булці.
Гіпергеометричний розподіл
Нехай є сукупність N елементів, з яких М елементів мічені, а решта N-M елементів не мічені. Із сукупності вибирають n елементів. Х – кількість мічених елементів серед вибраних. Такий розподіл називають гіпергеометричним. (Пригадайте задачу про лотерейні білети із лекції 1. Х – кількість виграшних білетів серед куплених.)
З допомогою комбінаторики знаходимо P(X=k)= для всіх можливих значень k, тобто при . Для інших k ця ймовірність очевидно дорівнює нулю.
Можна вважати, що n елементів вибирають послідовно. Позначимо – кількість мічених елементів при виборі першого елемента, – при виборі другого, ..., – при виборі останнього елемента. Ці випадкові величини є рівноправними (дивись задачу про щасливий екзаменаційний білет), тобто, мають однаковий розподіл (закон розподілу), а саме

0
1

Р
1-М/N
M/N

Можна позначити p=M/N, q=1-p.
Х=. Аналогія з біноміальним розподілом, але, на відміну від біноміального розподілу тут випадкові величини є залежними.
Обчислимо числові характеристики гіпергеометричного розподілу:
МХ=М() = =nM/N=np,

Обчислимо окремо:.
Врахувавши симетрію і те, що кількість подвоєних добутків буде обчислюємо далі :
.
DX=(Вправа. Розписати і перевірити.)
Як бачимо, при великих N і малих (набагато менших) n математичне сподівання та дисперсія гіпергеометричного розподілу майже такі ж як у біноміального. Це невипадково. Біноміальний розподіл є граничним до гіпергеометричного при великих N і малих n , тобто, коли те що взяли попередні мічені чи не мічені не сильно впливає на загальний відсоток мічених і на наступний вибір елемента. Справедлива формула: .(Неважко довести, тут n та k фіксовані (сталі). Вправа. Довести.)
Геометричний розподіл
Геометричний розподіл – це розподіл кількості промахів до першого успіху при повторних незалежних випробуваннях. Можливі значення: 0, 1, 2, ... .
Їх ймовірності , де – успіх у і-тому випробуванні, p – ймовірність успіху в одному випробуванні, q=1-p – ймовірність промаху, k=0, 1, 2, ... .
Геометричний розподіл є дискретним аналогом показникового: згадаємо, що показниковим розподілом є час до наступної події при найпростішому потоці подій і співставимо з геометричним розподілом – кількістю випробувань до першого успіху.
Обчислимо числові характеристики геометричного розподілу:
MX==
==(cума геометр.ряду ) =.
==
=
.
DX=.
Вправа: обчислити моду та медіану геометричного розподілу.