И.М. Тришин
Теория вероятностей
Тема 1. Основные понятия и теоремы теории
вероятностей
1.1. Понятие случайного события
Испытанием мы будем называть тип опыта (эксперимента).
Например, извлечение наудачу карты из колоды – испытание.
Бросание наудачу игральной кости (монеты) – испытание.
Существенно, что испытания в приведенных примерах (как и все испытания в данном курсе) выполняются наудачу, т.е. субъективный фактор здесь предполагается исключенным.
Определение. Случайным событием называется выделенный исход некоторого испытания.
Очевидно, что в конкретном испытании рассматриваемое случайное событие может наступить, а может и не наступить. (Отметим также, что сам эпитет “случайное” EMBED Equation.3 перед термином “событие“ в дальнейшем для краткости мы обычно будем опускать.)
Всюду ниже для обозначения событий мы будем использовать заглавные буквы EMBED Equation.3 EMBED Equation.3 латинского алфавита (возможно, с индексами). Например, EMBED Equation.3 ,B,C,? EMBED Equation.3 или EMBED Equation.DSMT4 .
Пример. Пусть испытание – извлечение карты из колоды. Тогда событиями являются: A– извлечена карты красной масти, B – извлечена “ картинка“, C – извлечен туз и т.п. Если в результате конкретного испытания из колоды достали, например, семерку бубен, то событие A наступило, события B и C – нет.
Пример. Пусть испытание – бросание игральной кости. Тогда событиями являются, например, A – EMBED Equation.3 число выпавших очков – четно, B – число выпавших очков – больше 4, C– на верхней грани игральной кости выпала “5”.
Удобным обозначением для событий, относящихся к рассматриваемому испытанию (бросание игральной кости), служит перечисление всех исходов благоприятствующих наступлению события. Например, здесь EMBED Equation.3 ={2,4,6}, EMBED Equation.3 ={5,6}, EMBED Equation.3 ={5}.
1.2. Статистическое определение вероятности EMBED Equation.3 EMBED Equation.3
Пусть проведено N испытаний, в которых некоторое событие A наступает EMBED Equation.3 раз. Тогда отношение EMBED Equation.3 называется частостью (долей) наступления события A в N испытаниях.
Определение. Пусть условия проведения некоторого испытания можно в точности воспроизвести неограниченное число раз. Тогда вероятностью EMBED Equation.3 наступления события A (в одном испытании) называется такое число, около которого группируются значения частости EMBED Equation.3 при неограниченном увеличении числа EMBED Equation.3 испытаний N .
Символически это определение можно записать в виде
EMBED Equation.3
Отметим практическое следствие данного определения: если нас интересует значение вероятности наступления некоторого события EMBED Equation.3 , то производят достаточно большое число испытаний N, по их результатам определяют значение частости EMBED Equation.3 и затем полагают
EMBED Equation.3 EMBED Equation.3
(Более подробно обоснование такого подхода будет рассмотрено ниже: см. Закон больших чисел, теорему Бернулли.)
Также статистическое определение вероятности имеет следующее важное
Следствие (область возможных значений вероятности события). Значение вероятности произвольного события EMBED Equation.3 заключено в границах от 0 до 1, т.е.
EMBED Equation.3
Доказательство. Очевидно, что
EMBED Equation.3
Выполняя почленное деление последнего неравенства на EMBED Equation.3 , получаем
EMBED Equation.3
Переходя теперь к пределу при EMBED Equation.3 , имеем
EMBED Equation.3
1.3. Классификация случайных событий
1. Определение. Два события называются равными, если одно из них наступает тогда и только тогда, когда наступает другое.
Пример. Будут произведены 3 выстрела в мишень. А – число попаданий в мишень равно 0, В – число попаданий в мишень меньше, чем 0,5. Очевидно, что EMBED Equation.3
2. Определение. Два события называются равновозможными, если вероятности их наступления равны (в смысле статистического определения вероятности).
На практике равновозможность событий обычно усматривается из симметрии ситуации.
Пример. Пусть испытание – бросание монеты. Тогда события EMBED Equation.3 – выпадение “орла” и EMBED Equation.3 – выпадение “решки” являются равновозможными.
3. Определение. Событие называется достоверным, если оно наступает в каждом из испытаний.
Достоверное событие будем обозначать через EMBED Equation.3 Такое событие определено однозначно для каждого вида испытания.
Пример. Пусть испытание – бросание игральной кости. Тогда EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 где m – число выпавших очков.
Т.к. EMBED Equation.3 , то EMBED Equation.3 т.е.
EMBED Equation.3
4. Определение. Событие называется невозможным, если оно не наступает ни в одном из испытаний.
Невозможное событие будем обозначать символом ?. Это событие определено однозначно для каждого вида испытания.
Пример. Пусть измеряется рост наудачу взятого человека. Тогда ? = (значение роста – отрицательное число) = (рост – более 100 км) =….
Т.к. EMBED Equation.3 то EMBED Equation.3 т.е.
EMBED Equation.3
5. Определение. Два события называются несовместными (несовместимыми), если они не могут наступить одновременно.
Пример. Испытание – извлечение карты из колоды. Если событие А – извлечена карта красной масти, событие В – извлечена карта черной масти, то А и В – несовместны.
Пример. Пусть по мишени производится 3 выстрела и m – число попаданий в мишень. Тогда события, например, EMBED Equation.3 и EMBED Equation.3 – несовместны.
6. Определение. События EMBED Equation.3 называются единственно возможными для некоторого испытания, если в результате испытания хотя бы оно из них обязательно наступает.
Пример. Пусть испытание – бросание игральной кости. EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 Тогда события А и В – единственно возможны (т.к. не существует такого исхода бросания игральной кости, при котором ни А, ни В не наступило). Напротив, А и С не являются единственно возможными (т.к. при выпадении “6” ни А, ни С не наступают).
7. Определение. Говорят, что события EMBED Equation.3 образуют полную систему (группу), если эти события попарно несовместимы и единственно возможны.
Пример. Пусть испытание – бросание игральной кости. Тогда события EMBED Equation.3 образуют полную систему.
Пример. Пусть по мишени производится 3 выстрела и m – число попаданий в мишень. Тогда события, например, EMBED Equation.3 образуют полную систему.
Заметим, что при заданном типе испытания полная система событий определена, вообще говоря, неоднозначно.
Определение. Если два события образуют полную систему, то они называются парой взаимно противоположных событий.
Если одно из событий такой пары обозначено, скажем, через EMBED Equation.3 , другое будет обозначено EMBED Equation.3
Пример. Пусть испытание – бросание монеты. Тогда события А – выпадение “орла” и В – выпадение “решки” являются взаимно противоположными ( EMBED Equation.3 ).
Пример. Пусть по мишени производится 3 выстрела, и m – число попаданий в мишень. Тогда события, например, EMBED Equation.3 и EMBED Equation.3 – взаимно противоположны.
1.4. Операции над событиями
Определение. Суммой событий А и В называется такое событие EMBED Equation.3 , которое считается наступившим тогда и только тогда, когда наступило или событие А, или событие В, или оба эти события вместе.
Пример. Пусть испытание – извлечение карты из колоды, а следующие события состоят в извлечении: А – карты красной масти, В – картинки, D – числовой карты. Если в результате конкретного испытания из колоды достали, например, “семерку” крестей то событие А+В не наступило, а события EMBED Equation.3 и EMBED Equation.3 наступили.
Пример. Пусть по мишени производится 3 выстрела, m – число попаданий в мишень EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 , EMBED Equation.3 . Тогда EMBED Equation.3 .
Замечание 1. Условие единственной возможности событий EMBED Equation.3 равносильно тому, что EMBED Equation.3 В частности, если события EMBED Equation.3 образуют полную систему, то EMBED Equation.3 , и при EMBED Equation.3 имеем
EMBED Equation.3
Определение. Произведением событий А и В называется такое событие EMBED Equation.3 , которое считается наступившим тогда и только тогда, когда события А и В наступили одновременно.
Пример. Пусть испытание состоит в бросании игральной кости.
EMBED Equation.3 EMBED Equation.3 . Тогда EMBED Equation.3 и EMBED Equation.3 .
Замечание 2. Произвольные события А и В являются несовместимыми тогда и только тогда, когда EMBED Equation.3 ?.
1.5. Классическое определение вероятности
Определение. Пусть некоторое испытание имеет n исходов, причем эти исходы
а) попарно несовместимы;
б) единственно возможны;
в) равновозможны
и наступлению события А благоприятствует EMBED Equation.3 исходов из EMBED Equation.3 Тогда вероятность EMBED Equation.3 наступления события А (в одном испытании) определяется по формуле
EMBED Equation.3
Пример. В коробке имеется 10 хороших деталей и 5 бракованных. Наудачу из коробки извлекается одна деталь. Найти вероятность наступления события А – извлеченная деталь – хорошая.
Решение. Общее число исходов EMBED Equation.3 равно полному числу деталей в коробке. Извлечению хорошей детали благоприятствует EMBED Equation.3 исходов из общего числа (число хороших деталей). Тогда
EMBED Equation.3
Пример. Одновременно бросаются три монеты. Найти вероятность того, что на двух из них выпадет “орел”.
Решение. Для удобства будем предполагать, что монеты некоторым образом занумерованы. Единичным исходом здесь является совокупный результат по трем монетам (другими словами, для того, чтобы задать единичный исход, надо сказать, что выпало на первой монете, на второй и на третьей). Перечислим возможные исходы (см. Таблицу 1, в которой выпадение “орла” на соответствующей монете обозначено буквой “О”, “решки” – “Р”). Видно, что общее число EMBED Equation.3 исходов равно 8. Число EMBED Equation.3 благоприятствующих исходов равно 3 – это исходы с номерами 2, 3, 5 Таблицы 1. Тогда
EMBED Equation.3 .
Пример. В коробке 6 белых шаров и 8 красных. Наудачу одновременно извлекаются 3 шара. Найти вероятность, того, что среди них будут:
а) два белых шара;
б) не менее одного белого.
Решение. а) Для удобства будем предполагать, что имеющиеся шары некоторым образом перенумерованы. Пусть, например, белые шары имеют номера 1, 2, … ,6 красные – 7, 8 , … ,14. Тогда единичным исходом является произвольная тройка номеров: EMBED Equation.3 , EMBED Equation.3 , …, EMBED Equation.3 . ( Оставляем читателю в качестве упражнения проверку того, что данные исходы удовлетворяют всем условиям классического определения вероятностей.)
Тогда общее число n исходов равно числу способов, которыми можно выбрать 3 номера из имеющихся 14-ти номеров. Напомним, что такое число равно соответствующему числу сочетаний:
EMBED Equation.3 .
(В общем случае,
EMBED Equation.3
равно числу способов, которыми можно выбрать s объектов из k имеющихся объектов.) Таким образом,
EMBED Equation.3 = EMBED Equation.3
Найдем теперь число m исходов, благоприятствующих появлению двух белых шаров среди трех извлеченных. Число способов, которыми можно выбрать 2 шара из имеющихся 6-ти белых шаров, равно EMBED Equation.3 . Но число благоприятствующих исходов с фиксированной парой белых шаров равно числу способов, которыми можно выбрать оставшийся красный шар в тройку, т.е. равно EMBED Equation.3 . Поэтому
EMBED Equation.3
Окончательно имеем
EMBED Equation.3
где А – событие состоящее в том, что среди трех отобранных шаров ровно 2 белых шара.
б) Полное число n исходов найдено в п. а). Число троек, в которых не менее 2-х белых шаров, равно сумме троек с двумя белыми шарами и троек с тремя белыми шарами:
EMBED Equation.3
Окончательно имеем
EMBED Equation.3 EMBED Equation.3
где В – событие состоящее в том, что среди трех отобранных шаров не менее 2-х белых шаров.
1.6. Основные теоремы теории вероятностей
Теорема сложения вероятностей.
EMBED Equation.3
Важным частным случаем этой теоремы является
Теорема сложения вероятностей для несовместных событий. Вероятность суммы двух несовместных событий равна сумме их вероятностей, т.е.
EMBED Equation.3
Доказательство. Так как события А и В несовместны, то их произведение равно невозможному событию, т.е. АВ = ?. Поскольку вероятность невозможного события равна нулю (см. § 1.3), то из теоремы сложения вероятностей следует требуемое утверждение.
Отметим, что аналогичное утверждение справедливо для любого числа попарно несовместных событий: вероятность суммы попарно несовместных событий равна сумме их вероятностей.
Следствие. Пусть события EMBED Equation.3 образуют полную систему, тогда сумма их вероятностей равна 1 т.е.
EMBED Equation.3
Доказательство. Из определения полной системы следует, что события EMBED Equation.3 , в частности, являются единственно возможными, поэтому EMBED Equation.3 (см. § 1.4). Тогда
EMBED Equation.3
Вероятность достоверного события равна 1 (см. § 1.3). События EMBED Equation.3 , в частности, являются попарно несовместными. Тогда из теоремы сложения вероятностей для несовместных событий следует требуемое утверждение.
Данное следствие при EMBED Equation.3 представляет важное свойство противоположных событий: сумма вероятностей взаимно противоположных событий равна 1, т.е.
EMBED Equation.3
Определение. Условной вероятностью EMBED Equation.3 называется вероятность наступления события А в предположении наступления события В.
Определение. Два события называются независимыми, если вероятность наступления одного из них не зависит от того, считается ли другое событие наступившим или нет.
Данное определение равносильно следующему:
события А и В независимы ? EMBED Equation.3
Пример. Пусть испытание состоит в извлечении карты из колоды. Событие А – извлечена “ картинка”, событие В – извлечена “7”. Выяснить, являются ли события А и В независимыми.
Решение. Так как среди “ картинок” нет “семерок”, то EMBED Equation.3 . Так как среди “не картинок” – 4 “семерки”, то EMBED Equation.3 . Таким образом,
EMBED Equation.3 , поэтому события А и В зависимы. Аналогично, в общем случае произвольные (неравные) несовместные события – зависимы.
Теорема (необходимое и достаточное условие независимости событий). События А и В независимы тогда и только тогда, когда
EMBED Equation.3
Пример. Пусть испытание состоит в бросании игральной кости, EMBED Equation.3 EMBED Equation.3 Выяснить, являются ли события А и В независимыми.
Решение. Очевидно, что EMBED Equation.3 В предположении обязательного наступления события В, полное число возможных исходов равно 4, из которых 2 исхода благоприятствуют наступлению события А, поэтому EMBED Equation.3 Так как EMBED Equation.3 то события А и В – независимы.
Теорема умножения вероятностей.
Теорема умножения вероятностей для независимых событий. Вероятность произведения двух независимых событий равна произведению их вероятностей, т.е.
EMBED Equation.3 .
Аналогичное утверждение справедливо для любого числа независимых событий.
Пример. Два стрелка одновременно выстреливают в мишень. Вероятность попадания для первого стрелка равна 0,6, для второго – 0,8. Найти вероятность того, что в мишени будет:
а) одна пробоина;
б) хотя бы одна пробоина.
Решение. а) Прежде всего, укажем, когда может наступать интересующее нас событие, перебирая все возможные варианты.
В мишени будет одна пробоина
тогда и только тогда, когда
первый стрелок попал и второй стрелок промахнулся
или
первый стрелок промахнулся и второй стрелок попал.
Пусть событие А – в мишени будет одна пробоина, событие EMBED Equation.3 – первый стрелок попал, событие EMBED Equation.3 – второй стрелок попал. Тогда EMBED Equation.3 – первый стрелок промахнулся,
EMBED Equation.3 – второй стрелок промахнулся. “Тогда и только тогда, когда” соответствует отношению равенства событий. Соединительный союз “или” соответствует операции сложения событий. Соединительный союз “и” соответствует умножению событий. Тогда фраза русского языка, в которой мы перечислили все возможности для наступления события А, равносильна следующему символическому равенству
EMBED Equation.3
Откуда следует равенство вероятностей
EMBED Equation.3
Так как события EMBED Equation.3 и EMBED Equation.3 несовместны, то, применяя теорему сложения вероятностей для несовместных событий, приходим к равенству
EMBED Equation.3
События EMBED Equation.3 , EMBED Equation.3 и EMBED Equation.3 , EMBED Equation.3 попарно независимы, поэтому, применяя теорему умножения вероятностей для независимых событий, получаем
EMBED Equation.3
По условию, EMBED Equation.3 и EMBED Equation.3 Тогда, по свойству взаимно противоположных событий (см. следствие из теоремы сложения вероятностей для несовместных событий, EMBED Equation.3 ), EMBED Equation.3 и EMBED Equation.3 Окончательно имеем
EMBED Equation.3
б) Пусть EMBED Equation.3 – число попаданий в мишень, тогда искомой является вероятность EMBED Equation.3 (заметим, что слова “хотя бы один”, “не менее чем один”, “по-крайней мере один” являются синонимами). Событие EMBED Equation.3 равносильно тому, что число попаданий в мишень будет равно 1 или 2, т.е.
EMBED Equation.3
Тогда, учитывая несовместность событий EMBED Equation.3 и EMBED Equation.3 , получаем
EMBED Equation.3
EMBED Equation.3 (см. п. а) данного примера). Событие EMBED Equation.3 (два попадания в мишень) наступает тогда и только тогда, когда первый стрелок попадет в мишень и второй стрелок попадет, т.е.
EMBED Equation.3 .
Поэтому
EMBED Equation.3
(см. теорему умножения вероятностей для независимых событий). Окончательно имеем
EMBED Equation.3 EMBED Equation.3
Отметим, что эта задача допускает и другое решение. Так как события EMBED Equation.3 и EMBED Equation.3 взаимно противоположны, то
EMBED Equation.3 .
Но EMBED Equation.3 Следовательно
EMBED Equation.3
Пример. В коробке лежат 4 белых шара и 6 красных. Наудачу, один за другим из коробки извлекается 2 шара. Найти вероятность того, что среди них будет:
а) один красный шар;
б) менее 2-х красных шаров.
Решение. а) Пусть событие А – среди двух извлеченных шаров – ровно один красный. Это событие наступает тогда и только тогда, когда первый из извлеченных шаров – красный, а второй – белый или первый шар – белый, а второй – красный. Напомним, что соединительный союз “или” соответствует сложению событий, союзы “и”, “а” соответствуют умножению событий. Тогда описание всех возможностей наступления события А равносильно следующему формальному равенству
EMBED Equation.3 ,
где EMBED Equation.3 ( EMBED Equation.3 ) – первый (второй) шар – красный, EMBED Equation.3 ( EMBED Equation.3 ) – первый (второй) шар – белый. События EMBED Equation.3 и EMBED Equation.3 – несовместны, поэтому, используя теорему сложения вероятностей для несовместных событий, получаем
EMBED Equation.3 EMBED Equation.3 .
Применяя теперь теорему умножения вероятностей, приходим к равенству
EMBED Equation.3 .
Для вычисления вероятностей из правой части последнего равенства используем классическое определение вероятности. Тогда
EMBED Equation.3
б) Пусть m – число красных шаров среди двух извлеченных. Тогда искомой является вероятность EMBED Equation.3 Очевидно, что EMBED Equation.3 , и EMBED Equation.3 (см. п. а) данного примера). Вместе с тем, событие EMBED Equation.3 – среди извлеченных шаров нет красных – равносильно тому, что первый шар окажется белым и второй – также белым, т.е. EMBED Equation.3 , поэтому
EMBED Equation.3
Окончательно имеем
EMBED Equation.3
Заметим, что вероятность EMBED Equation.3 может быть также найдена по-другому. События EMBED Equation.3 и EMBED Equation.3 взаимно противоположны, поэтому
EMBED Equation.3
Но
EMBED Equation.3
Тогда
EMBED Equation.3
Домашнее задание (здесь и далее номера задач указаны по учебнику Н.Ш. Кремера “Теория вероятностей и математическая статистика”): 1.54, 1.58, 1.60, 1.61, 1.64, 1.69.
1.7. Формула полной вероятности. Формула Байеса (гипотез)
Теорема. Пусть события EMBED Equation.3 образуют полную систему и F – некоторое событие. Тогда справедлива формула
EMBED Equation.3 ,
которая и называется формулой полной вероятности.
Пусть событие F отлично от невозможного, тогда
EMBED Equation.3
где EMBED Equation.3 Данная формула называется формулой Байеса (гипотез).
Пример. Объемы продукции, изготавливаемой двумя рабочими, относятся как 3:2. Вероятности брака для деталей первого и второго рабочих равны соответственно 0,02 и 0,01. Найти вероятность того, что деталь, извлеченная наудачу из не рассортированной продукции,
а) является бракованной;
б) изготовлена первым рабочим, если известно, что она бракована.
Решение. а) Введем в рассмотрение события: EMBED Equation.3 – деталь изготовлена первым рабочим, EMBED Equation.3 – деталь изготовлена вторым рабочим, F – деталь бракована. Из условия следует, что всю продукцию можно предполагать состоящей из 5-ти частей (3+2=5), причем на долю первого рабочего приходится 3 части из этих 5-ти, на долю второго – 2 части. Тогда, по классическому определению вероятности, EMBED Equation.3 , EMBED Equation.3 . По условию, EMBED Equation.3 EMBED Equation.3 и по формуле полной вероятности получаем
EMBED Equation.3 ,
б) EMBED Equation.3
Домашнее задание: 1.72, 1.75.
Тема 2. Повторные независимые испытания
2.1. Формула Бернулли
Сначала рассмотрим задачу – частный случай задач предыдущей темы. Наблюдение над решением позволит нам получить формулу, существенно упрощающую вычисления в аналогичных случаях.
Пример. Предполагается произвести 4 выстрела по мишени. Вероятность попадания при каждом выстреле считается известной и равной 0,7. Найти вероятность того, что
число попаданий в мишень будет:
а) равно 2;
б) не менее 2-х;
в) менее 4-х.
Решение. а) Принципиально эта задача не отличается от задачи о двух стрелках из § 1.6 (повторные испытания и здесь независимы) и может быть решена тем же способом. Введем обозначения, которые ниже будем использовать в подобных случаях. Число выстрелов по мишени обозначим через n (здесь EMBED Equation.3 ), EMBED Equation.3 – вероятность попадания в мишень при каждом выстреле, EMBED Equation.3 – вероятность промаха при каждом выстреле, EMBED Equation.3 – число попаданий. Требуется найти EMBED Equation.3 , эту же вероятность обозначим через EMBED Equation.3 . Перебирая все случаи, в которых число попаданий в мишень будет равно 2, получаем
EMBED Equation.3
EMBED Equation.3 .
В общем случае справедлива
Теорема. Пусть произведено n повторных независимых испытаний, в каждом из которых некоторое событие А наступает с вероятностью p. Тогда вероятность EMBED Equation.3 того, что в этих n испытаниях событие А наступит EMBED Equation.3 раз, вычисляется по формуле
EMBED Equation.3
где EMBED Equation.3 – число сочетаний из n по EMBED Equation.3 , EMBED Equation.3 .
Полученная формула носит название формулы Бернулли.
Завершим рассмотрение нашего примера.
б) Так как EMBED Equation.3 то, применяя теорему сложения вероятностей для несовместных событий, получаем
EMBED Equation.3
Первое слагаемое последней суммы найдено в п. а) данного примера. Аналогично для остальных:
EMBED Equation.3
EMBED Equation.3
Окончательно имеем
EMBED Equation.3
в) По аналогии с предыдущим пунктом задания,
EMBED Equation.3
т.е. решение требует, вообще говоря, четырех применений формулы Бернулли. Однако возможно и более короткое решение. Действительно, события EMBED Equation.3 и EMBED Equation.3 – взаимно противоположны, следовательно
EMBED Equation.3
Вероятность EMBED Equation.3 найдена в п. б) примера. Таким образом, получаем
EMBED Equation.3
Домашнее задание: 2.15, 2.16, 2.18.
2.2. Формула Пуассона (редких событий)
Теорема. Пусть произведено n повторных независимых испытаний, в каждом из которых некоторое событие А наступает с вероятностью p , причем
а) число испытаний достаточно велико ( EMBED Equation.3 ;
б) EMBED Equation.3
Тогда вероятность EMBED Equation.3 того, что в этих n испытаниях событие А наступит EMBED Equation.3 раз, вычисляется по следующей приближенной формуле
EMBED Equation.3
Эта формула и называется формулой Пуассона (редких событий).
Пример. По каналу связи передано 1000 сигналов. Вероятность ошибки при передаче каждого из сигналов равна 0,005. Найти вероятность того, что неверно передано:
а) 7 сигналов;
б) не менее 4-х сигналов.
Решение. а) Воспользуемся формулой Пуассона, т.к. условия ее применимости в данном случае выполнены: число испытаний достаточно велико EMBED Equation.3 и EMBED Equation.3 Искомое значение EMBED Equation.3 найдем по таблице функции Пуассона при EMBED Equation.3 и EMBED Equation.3 (см. учебник Н.Ш. Кремера, с.556): EMBED Equation.3
б) Требуется найти EMBED Equation.3 , где m – число неверно принятых сигналов. Так как EMBED Equation.3 то EMBED Equation.3
Искать каждое из слагаемых этой суммы и затем выполнять суммирование – такое решение не представляется рациональным из-за большого числа слагаемых и потому, что таблица функции Пуассона не дает искомых значений с требуемой в данном случае точностью. Воспользуемся переходом к противоположному событию: EMBED Equation.3
Находя вероятности из правой части последнего равенства по таблице функции Пуассона, окончательно получаем
EMBED Equation.3
Домашнее задание: 2.20, 2.22б.
2.3. Локальная теорема Муавра-Лапласа
Теорема. Пусть произведено n повторных независимых испытаний, в каждом из которых некоторое событие А наступает с вероятностью p , причем число испытаний достаточно велико ( EMBED Equation.3 .Тогда вероятность EMBED Equation.3 того, что в этих n испытаниях событие А наступит EMBED Equation.3 раз, вычисляется по следующей приближенной формуле
EMBED Equation.3
где EMBED Equation.3 – функция Гаусса, EMBED Equation.3 EMBED Equation.3
Пример. Имеется партия деталей, состоящая из 1000 штук. В среднем среди деталей такого вида стандартные детали составляют 90?. EMBED Equation.3 Найти вероятность того, что число стандартных деталей в данной партии окажется равным 890.
Решение. Число испытаний в данном случае достаточно велико EMBED Equation.3 , поэтому локальная теорема Муавра-Лапласа применима. Из условия следует, что вероятность быть стандартной для произвольной детали данной партии равна EMBED Equation.3
EMBED Equation.3 , EMBED Equation.3 , EMBED Equation.3 . Тогда
EMBED Equation.3
По локальной теореме Муавра-Лапласа,
EMBED Equation.3
Учитывая, что функция Гаусса четная, используя таблицу этой функции (см. учебник Н.Ш. Кремера, с. 553-554), находим EMBED Equation.3 Окончательно, получаем
EMBED Equation.3
Свойства функции Гаусса.
x y EMBED Equation.3 Рис.1 1) Функция Гаусса четна: EMBED Equation.3 , поэтому ее график симметричен относительно оси EMBED Equation.3 ;
2) EMBED Equation.3 при всех EMBED Equation.3 , т.е. график EMBED Equation.3 расположен строго выше оси EMBED Equation.3 ;
3) EMBED Equation.3 , т.е. ось EMBED Equation.3 является горизонтальной асимптотой графика этой функции; на практике полагаем EMBED Equation.3 .
Схематично график функции Гаусса изображен на рис. 1.
Домашнее задание. 2.21а, 2.25, 2.27а.
2.4. Интегральная теорема Муавра-Лапласа
Теорема. Пусть произведено n повторных независимых испытаний, в каждом из которых некоторое событие А наступает с вероятностью p , причем число испытаний достаточно велико ( EMBED Equation.3 .Тогда вероятность того, что число m наступлений события А в этих n испытаниях будет заключено в границах от EMBED Equation.3 до EMBED Equation.3 , вычисляется по следующей приближенной формуле
EMBED Equation.3
где EMBED Equation.3 – функция Лапласа, EMBED Equation.3 .
Пример. Каждая из 1000 деталей партии стандартна с вероятностью 0,9. Найти вероятность того, что число стандартных деталей этой партии будет не меньше 880.
Решение. Число n повторных независимых испытаний в данном случае равно числу деталей в партии (каждая из деталей партии будет проверяться на предмет качества, а в этой проверке и состоит испытание). EMBED Equation.3 поэтому интегральная теорема Муавра-Лапласа применима; неравенство EMBED Equation.3 , где EMBED Equation.3 – число стандартных деталей в партии, здесь равносильно EMBED Equation.3 поэтому EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 Тогда
EMBED Equation.3
EMBED Equation.3
По свойствам функции Лапласа (см. ниже), EMBED Equation.3 , EMBED Equation.3 По таблице функции Лапласа (см. учебник Н.Ш. Кремера, с. 555) находим EMBED Equation.3 Тогда окончательно имеем
EMBED Equation.3
y x -1 Рис. 2 EMBED Equation.3 1
Свойства функции Лапласа
Функция Лапласа нечетна: EMBED Equation.3
Функция Лапласа – монотонно возрастающая;
EMBED Equation.3 EMBED Equation.3 т.е. прямые EMBED Equation.3 и EMBED Equation.3 EMBED Equation.3 являются горизонтальными асимптотами (правой и левой соответственно) графика EMBED Equation.3 ; на практике полагаем EMBED Equation.3 при EMBED Equation.3
График функции Лапласа схематично изображен на рис. 2.
EMBED Equation.3
Следствия из интегральной теоремы Муавра-Лапласа
Пусть выполнены условия применимости интегральной теоремы Муавра-Лапласа.
Следствие 1. Вероятность того, что число EMBED Equation.3 наступлений события А в n повторных независимых испытаниях будет отличаться от величины EMBED Equation.3 не более чем на EMBED Equation.3 (по абсолютной величине), вычисляется по формуле
EMBED Equation.3
Следствие 2. Вероятность того, что доля EMBED Equation.3 наступлений события А в n повторных независимых испытаниях будет отличаться от вероятности p наступления этого события в одном испытании не более чем на EMBED Equation.3 (по абсолютной величине), вычисляется по формуле
EMBED Equation.3
Пример. Подлежат исследованию 1000 проб руды. Вероятность промышленного содержания металла в каждой пробе равна 0,15. Найти границы, в которых с вероятностью 0,9973 будет заключено число проб руды с промышленным содержанием металла.
Решение. Искомые границы для числа EMBED Equation.3 проб руды с промышленным содержанием металла (из данных 1000 проб) определяются величинами EMBED Equation.3 и EMBED Equation.3 (см. интегральную теорему Муавра-Лапласа). Будем предполагать, что искомые границы симметричны относительно величины EMBED Equation.3 , где EMBED Equation.3 и EMBED Equation.3 . Тогда EMBED Equation.3 , EMBED Equation.3 для некоторого EMBED Equation.3 , и, тем самым, единственной определяющей неизвестной данной задачи становится величина EMBED Equation.3 . Из следствия 1 и условия задачи следует, что
EMBED Equation.3
По таблице значений функции Лапласа найдем такое EMBED Equation.3 , что EMBED Equation.3 EMBED Equation.3
Тогда EMBED Equation.3 и EMBED Equation.3 . Окончательно получаем искомые границы: EMBED Equation.3 EMBED Equation.3 т.е. с вероятностью 0,9973 число проб руды с промышленным содержанием металла (из данных 1000 проб) попадет в интервал (116; 184).
Пример. В лесхозе приживается в среднем 80? саженцев. Сколько саженцев надо посадить, чтобы с вероятностью 0,9981 можно было утверждать, что доля прижившихся саженцев будет находиться в границах от 0,75 до 0,85.
Решение. EMBED Equation.3 – вероятность прижиться для каждого из саженцев, EMBED Equation.3 . Пусть EMBED Equation.3 – необходимое число саженцев (искомая величина данной задачи) и EMBED Equation.3 – число прижившихся из них, тогда EMBED Equation.3 – доля прижившихся саженцев. По условию,
EMBED Equation.3
Данные границы для доли EMBED Equation.3 симметричны относительно величины EMBED Equation.3 , поэтому неравенство EMBED Equation.3 равносильно неравенству EMBED Equation.3
Следовательно, вероятность 0,9981 – это та самая вероятность, которая вычисляется по следствию 2 из интегральной теоремы Муавра-Лапласа при EMBED Equation.3 , EMBED Equation.3 EMBED Equation.3 :
EMBED Equation.3
По таблице функции Лапласа найдем такое значение EMBED Equation.3 , что EMBED Equation.3 Это значение: EMBED Equation.3 Тогда
EMBED Equation.3
EMBED Equation.3 и
EMBED Equation.3
Заметим, что значение EMBED Equation.3 округлено до целых в большую сторону, чтобы обеспечить, как говорят, “запас по вероятности”. Кроме того, видно, что полученное значение EMBED Equation.3 достаточно велико (более 100), поэтому применение интегральной теоремы Муавра-Лапласа для решения данной задачи было возможно.
Тема 3. Дискретная случайная величина
3.1. Закон распределения дискретной случайной величины
Определение. Случайной величиной называется переменная, которая в результате испытания принимает то или иное числовое значение.
Пример. Число попаданий в мишень при EMBED Equation.3 выстрелах – случайная величина.
Пример. Рост наудачу взятого человека – случайная величина.
Определение. Случайная величина называется дискретной, если число ее возможных значений конечно или счетно.
(Напомним, что множество называется счетным, если его элементы можно перенумеровать натуральными числами.)
В этом смысле, число попаданий в мишень – пример дискретной случайной величины. Рост человека – непрерывная случайная величина (такие случайные величины будут рассмотрены ниже).
Для обозначения случайных величин будем использовать заглавные буквы латинского алфавита (возможно с индексами), например, EMBED Equation.3 EMBED Equation.3 и т.п.
Определение. Законом распределения дискретной случайной величины называется такая таблица, в которой перечислены все возможные значения этой случайной величины (без повторений) с соответствующими им вероятностями.
В общем виде закон распределения для случайной величины, например, EMBED Equation.3 :
где EMBED Equation.3 EMBED Equation.3
Из определения закона распределения следует, что события EMBED Equation.3 EMBED Equation.3 … , EMBED Equation.3 образуют полную систему, поэтому (см. следствие из теоремы сложения вероятностей для несовместных событий в §1.6):
EMBED Equation.3
т.е.
EMBED Equation.3
Данное равенство называется основным свойством закона распределения.
Пример. Два стрелка одновременно выстреливают в мишень. Вероятность попадания для первого равна 0,6, для второго – 0,8. Составить закон распределения случайной величины EMBED Equation.3 – общего числа попаданий в мишень.
Решение. Возможные значения данной случайной величины: 0, 1, 2. Так же как в примере из §1.6, через EMBED Equation.3 и EMBED Equation.3 обозначим события, состоящие в попадании в мишень первого и второго стрелков (соответственно). Тогда аналогично упомянутому примеру получаем
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
Окончательно, закон распределения случайной величины EMBED Equation.3 имеет вид:
Упражнение. В коробке 3 белых шара и 2 красных. Составить закон распределения случайной величины EMBED Equation.3 – числа белых шаров среди 2-х извлеченных шаров.
Ответ.
Пример. В коробке – 3 белых шара и 2 красных. Шары извлекаются последовательно до появления белого шара. Составить закон распределения случайной величины Х – числа извлеченных шаров.
Решение. Возможные значения данной случайной величины: 1, 2, 3. Событие EMBED Equation.3 (из коробки будет извлечен один единственный шар) наступает тогда и только тогда, когда первый из шаров оказывается белым, т.к. появление именно белого шара является сигналом к прекращению последующих извлечений (см. условие). Поэтому
EMBED Equation.3
где событие EMBED Equation.3 – первый из извлеченных шаров – белый. Событие EMBED Equation.3 (из коробки будет извлечено ровно 2 шара) наступает тогда и только тогда, когда первый из извлеченных шаров оказывается красным, а второй – белым. Поэтому
EMBED Equation.3
где событие EMBED Equation.3 – первый из извлеченных шаров – красный, EMBED Equation.3 – второй шар – белый. Наконец событие EMBED Equation.3 (из коробки будет извлечено 3 шара) наступает тогда и только тогда, когда первый шар – красный, второй – красный и третий – белый. Поэтому
EMBED Equation.3
Окончательно искомый закон распределения имеет вид:
Упражнение. Имея 3 патрона, стрелок стреляет по мишени до первого попадания (или до израсходования патронов). Вероятность попадания при каждом выстреле равна 0,8. Составить закон распределения случайной величины Х – числа произведенных выстрелов.
Ответ.
Пример. Стрелок стреляет в мишень 3 раза. Вероятность попадания при каждом выстреле равна 0,8. Составить закон распределения случайной величины Х – числа попаданий в мишень.
Решение. Возможные значения для числа попаданий: 0, 1, 2, 3. Вероятности того, что случайная величина Х примет эти значения вычисляются по формуле Бернулли при EMBED Equation.3 EMBED Equation.3 EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
Окончательно искомый закон распределения имеет вид:
Полученный закон распределения является частным случаем так называемого биномиального закона распределения (при EMBED Equation.3 EMBED Equation.3 ).
Определение. Случайная величина Х имеет биномиальный закон распределения с параметрами EMBED Equation.3 и EMBED Equation.3 , если ее закон распределения имеет вид :
где вероятности EMBED Equation.3 вычисляются по формуле Бернулли:
EMBED Equation.3
EMBED Equation.3 – положительное целое число, EMBED Equation.3 EMBED Equation.3
В пределе при EMBED Equation.3 и EMBED Equation.3 биномиальное распределение переходит в так называемое распределение Пуассона.
Определение. Говорят, что случайная величина Х имеет распределение Пуассона с параметром EMBED Equation.3 , если ее закон распределения имеет вид:
где
EMBED Equation.3 ,
EMBED Equation.3 EMBED Equation.3 – положительное число.
Убедимся в том, что для распределения Пуассона выполняется основное свойство закона распределения: EMBED Equation.3 . Действительно, имеем
EMBED Equation.3
(см. курс математического анализа, разложение функции EMBED Equation.3 в ряд Маклорена).
Домашнее задание. 3.25, 3.31, 3.36, 3.40, 3.45.
3.2. Арифметические операции над случайными величинами
Определение. Случайные величины Х и Y называются равными, если их законы распределения точно совпадают, и для произвольного числа EMBED Equation.3 справедливо равенство: EMBED Equation.3
Пример. Пусть законы распределения случайных величин Х и Y имеют вид:
Эти случайные величины равны, если дополнительно справедливы равенства EMBED Equation.3 и EMBED Equation.3 , т.е. случайная величина Х принимает значение 0
тогда и только тогда, когда случайная величина Y принимает значение 0, и аналогично со значением 1.
Произвольная случайная величина допускает умножение на число. Действительно, пусть закон распределения случайной величины Х имеет вид:
и EMBED Equation.3 – некоторое число.
Определение. Случайной величиной EMBED Equation.3 называется такая случайная величина, закон распределения которой имеет вид :
Пример. Пусть закон распределения случайной величины Х имеет вид:
и EMBED Equation.3 , EMBED Equation.3 . Тогда закон распределения EMBED Equation.3 :
Можно придумать, например, следующую интерпретацию данному примеру. Заметим, что Х – биномиально распределена с параметрами EMBED Equation.3 EMBED Equation.3 . Пусть Х – число попаданий в мишень при 2-х выстрелах, при каждом из которых попадание случается с вероятностью 0,6, и дополнительно известно, что за каждое попадание стрелку выплачивается вознаграждение в размере 5 ден. ед. Тогда Y – заработок стрелка.
Определение. Случайные величины Х и Y называются независимыми, если для любых i и j события EMBED Equation.3 и EMBED Equation.3 – независимы.
Пример. Пусть из коробки, в которой – 6 белых и 8 красных шаров, извлекается 1 шар. Рассмотрим случайные величины Х – число белых шаров, Y – число красных шаров из извлеченных. События, например, EMBED Equation.3 и EMBED Equation.3 – несовместны, а поэтому – зависимы (см. § 1.6). Следовательно, и случайные величины Х и Y зависимы.
Определение. Суммой (разностью, произведением) случайных величин Х и Y называется такая случайная величина EMBED Equation.3 ( EMBED Equation.3 , EMBED Equation.3 ), которая принимает значение EMBED Equation.3 в некотором испытании, если значения EMBED Equation.3 и EMBED Equation.3 случайных величин Х и EMBED Equation.3 в этом испытании таковы, что EMBED Equation.3 ( EMBED Equation.3 ).
Пример. Пусть заданы законы распределения независимых случайных величин Х и Y:
Составить закон распределения случайной величины EMBED Equation.3 .
Решение. Удобно использовать вспомогательную таблицу вида:
в каждой из центральных клеток которой записаны соответствующие произведения случайных величин X и Y. Такая таблица показывает, какие значения принимает случайная величина U и когда она принимает эти значения. Так EMBED Equation.3 тогда и только тогда, когда EMBED Equation.3 и EMBED Equation.3 или EMBED Equation.3 и EMBED Equation.3 . Поэтому
EMBED Equation.3 .
Применяя теорему сложения вероятностей для несовместных событий, теорему умножения вероятностей – для независимых событий (по условию, случайные величины EMBED Equation.3 и EMBED Equation.3 – независимы), получаем
EMBED Equation.3
Для наступления каждого из двух оставшихся значений случайной величины U (-1 и 1) имеется по одной возможности. Например, EMBED Equation.3 тогда и только тогда, когда EMBED Equation.3 и EMBED Equation.3 . Тогда получаем:
EMBED Equation.3
Аналогично,
EMBED Equation.3
Окончательно, закон распределения случайной величины U имеет вид:
Заметим, что закон распределения случайной величины Z фактически найден в примере § 3.1 о двух стрелках. Действительно, исходные независимые случайные величины X иY данной задачи могут быть интерпретированы как числа попаданий в мишень первого и второго стрелка из § 3.1. Тогда EMBED Equation.3 – общее число попаданий, и закон распределения этой случайной величины и найден в упомянутом примере.
3.3. Параметры распределения дискретной случайной величины
Пусть закон распределения дискретной случайной величины Х имеет вид
Определение. Математическим ожиданием дискретной случайной величины Х называется число М(Х), вычисляемое по формуле
EMBED Equation.3
Математическое ожидание случайной величины есть число около которого группируются значения этой случайной величины.
Механическим аналогом математического ожидания дискретной случайной величины является центр масс (центр тяжести) системы точечных масс: если в точках числовой оси с абсциссами EMBED Equation.3 расположены точечные массы EMBED Equation.3 , то абсцисса их центра масс находится точно по формуле для EMBED Equation.3 , приведенной выше.
Пример. Пусть случайная величина Х биномиально распределена с параметрами EMBED Equation.3 и EMBED Equation.3 (см. пример из § 3.1):
Тогда
EMBED Equation.3
Свойства математического ожидания
Математическое ожидание постоянной случайной величины равно самой постоянной, т.е.
М(С)=С,
где С – некоторое число.
(Постоянной случайной величиной С называется такая случайная величина, которая принимает единственное значение равное С с вероятностью 1.)
Постоянный множитель можно выносить за знак математического ожидания, т.е.
EMBED Equation.3
где EMBED Equation.3 – произвольное число.
Математическое ожидание суммы (разности) случайных величин равно сумме (разности) математических ожиданий этих случайных величин, т.е.
EMBED Equation.3
4. Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий, т.е.
EMBED Equation.3
5. Пусть EMBED Equation.3 – такие случайные величины, математические ожидания которых равны между собой, т.е. EMBED Equation.3 где EMBED Equation.3 и а – некоторое число. Тогда среднее арифметическое этих случайных величин равно их общему математическому ожиданию, т.е.
EMBED Equation.3
Заметим, что свойства 2 – 5 математического ожидания остаются справедливыми также для непрерывных случайных величин.
Пусть закон распределения случайной величины Х тот же, что и выше (см. начало параграфа).
Определение. Дисперсией дискретной случайной величины Х называется число EMBED Equation.3 определяемое равенством
EMBED Equation.3
EMBED Equation.3
Число EMBED Equation.3 является мерой разброса значений случайной величины Х около ее математического ожидания.
Пример. Пусть случайная величина Х биномиально распределена с параметрами EMBED Equation.3 и EMBED Equation.3 . Найдем дисперсию этой случайной величины.
В предыдущем примере найдено, что М(Х) = 2,4. Тогда
EMBED Equation.3
Свойства дисперсии
Дисперсия постоянной случайной величины равна нулю, т.е.
EMBED Equation.3
Постоянный множитель можно выносить за знак дисперсии, возводя его при этом в квадрат, т.е.
EMBED Equation.3
где EMBED Equation.3 – произвольное число.
Справедливо равенство:
EMBED Equation.3
Дисперсия суммы (разности) двух независимых случайных величин равна сумме дисперсий этих случайных величин, т.е.
EMBED Equation.3
где случайные величины Х и Y – независимы.
Пусть случайные величины EMBED Equation.3 – независимы и EMBED Equation.3 где EMBED Equation.3 Тогда
EMBED Equation.3
Замечание. EMBED Equation.3 называется средним квадратическим отклонением случайной величины Х и обычно обозначается через EMBED Equation.3 .
Отметим также, что свойство 3 дисперсии более удобно для ее вычисления по сравнению с исходным определением дисперсии.
Пример. Пусть закон распределения случайной величины Х имеет вид
Найти EMBED Equation.3 используя свойство 3 дисперсии.
Решение.
EMBED Equation.3
EMBED Equation.3 EMBED Equation.3
Математическое ожидание и дисперсия случайной величины называются параметрами распределения этой случайной величины.
Теорема. Пусть случайная величина EMBED Equation.3 – биномиально распределена с параметрами EMBED Equation.3 и p , тогда параметры ее распределения могут быть найдены по формулам:
EMBED Equation.3
Также справедливы равенства
EMBED Equation.3
Пример. Пусть случайная величина Х биномиально распределена с параметрам EMBED Equation.3 и EMBED Equation.3 . Тогда
EMBED Equation.3
Очевидно, что использование формул последней теоремы упрощает и ускоряет вычисление математического ожидания и дисперсии биномиально распределенной случайной величины по сравнению с применением исходных определений для М(Х) и EMBED Equation.3
3.4. Функция распределения дискретной случайной величины
Определение. Функцией распределения случайной величины Х называется такая функция EMBED Equation.3 значение которой в точке x численно равно вероятности того, что в произвольном испытании значение случайной величины Х окажется меньше чем х, т.е.
EMBED Equation.3
Данное определение задает функцию распределения не только для дискретных, но и для непрерывных случайных величин.
Пример. Пусть закон распределения случайной величины Х имеет вид
Найти функцию распределения этой случайной величины.
Решение. Найдем сначала F(x) для некоторых значений переменной х. Например,
EMBED Equation.3
так как данная случайная величина не имеет значений меньших нуля, а потому событие (Х < 0) для нее является невозможным. Аналогично, при любом значении переменной х, которое менее или равно 1, будем иметь EMBED Equation.3 Далее имеем:
EMBED Equation.3
Аналогично, при любом значении переменной х таком, что EMBED Equation.3 , будем иметь EMBED Equation.3
EMBED Equation.3
(Или, другими словами, так как все значения данной случайной величины менее 2,5, то событие (Х < 2,5) является достоверным, а потому его вероятность равна 1.) Аналогично, при любом значении переменной х, которое более или равно 2, будем иметь EMBED Equation.3
Окончательно имеем:
EMBED Equation.3
F (x ) x 1 0,3 2 0,7 0,3 1 Рис. 3 График найденной функции распределения изображен на рис. 3.
Свойства функции распределения
Функция распределения является неубывающей функцией.
Область значений: EMBED Equation.3
Асимптотические свойства: EMBED Equation.3 EMBED Equation.3 (другими словами, прямые у =0 и у =1 являются асимптотами (левой и правой соответственно) графика y =F (x ) ).
Вероятность того, что в произвольном испытании значение случайной величины Х будет принадлежать полуинтервалу EMBED Equation.3 где EMBED Equation.3 и EMBED Equation.3 – произвольные числа, вычисляется по формуле
EMBED Equation.3 .
Доказательство. Значение функции распределения равна вероятности соответствующего события, но область значений вероятности есть отрезок EMBED Equation.3 – тем самым доказано свойство 2.
Используя определение функции распределения, получаем EMBED Equation.3 . Но произвольное значение случайной величины принадлежит числовой прямой, поэтому событие EMBED Equation.3 является невозможным. Вероятность невозможного события равна нулю (см. § 1.3), поэтому EMBED Equation.3
Аналогично, учитывая, что событие EMBED Equation.3 является достоверным, а вероятность такого события равна 1, получаем EMBED Equation.3
Нетрудно видеть, что
EMBED Equation.3
причем события правой части этого равенства несовместны. Принимая во внимание определение функции распределения и теорему сложении вероятностей для несовместных событий, получаем
EMBED Equation.3
что равносильно свойству 4.
Доказательство свойства 1 мы оставляем читателю в качестве упражнения (указание: используйте рассуждении от противного и свойство 4).
Тема 4. Непрерывная случайная величина
4.1. Плотность распределения непрерывной случайной величины
Неформально говоря, случайная величина непрерывна, если ее значения полностью заполняют некоторый интервал. Более точно, справедливо
Определение. Случайная величина называется непрерывной, если ее функция распределения непрерывна на всей числовой прямой и дифференцируема при всех х за исключением, быть может, отдельных значений.
Определение. Плотностью распределения непрерывной случайной величины Х называется такая функция EMBED Equation.3 что вероятность того, что в произвольном испытании значение случайной величины Х окажется принадлежащим некоторому отрезку EMBED Equation.3 , вычисляется по формуле
EMBED Equation.3
Принимая во внимание геометрический смысл определенного интеграла, получаем
Геометрический смысл плотности распределения. Вероятность того, что в произвольном испытании значение случайной величины Х окажется принадлежащим некоторому отрезку EMBED Equation.3 , численно равна площади EMBED Equation.3 под кривой плотности распределения на данном отрезке (см. рис. 4).
y x EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 Рис. 4 EMBED Equation.3
Пример. Пусть плотность распределения случайной величины Х имеет вид:
EMBED Equation.3
Найти вероятности:
а) EMBED Equation.3 б) EMBED Equation.3 в) EMBED Equation.3
Решение. а) По определению плотности распределения,
EMBED Equation.3
Вместе с тем, данная плотность распределения задана аналитически по-разному на промежутках EMBED Equation.3 и EMBED Equation.3 отрезка интегрирования. Соответственно, используя свойства определенного интеграла, получаем
EMBED Equation.3
По геометрическому смыслу плотности распределения, полученная вероятность численно равна площади под кривой плотности распределения (см. рис. 5) на отрезке EMBED Equation.3 , т.е. равна площади фигуры, составленной из отрезка длины 1 и прямоугольника со сторонами EMBED Equation.3 и 0,6.
-1 EMBED Equation.3 у х -2 1 -0,4 Рис. 5
б) Неравенство EMBED Equation.3 равносильно тому, что EMBED Equation.3 . Учитывая, что на промежутке EMBED Equation.3 данная плотность распределения равна 0, получаем
EMBED Equation.3
в) Аналогично предыдущим пунктам задачи, имеем
EMBED Equation.3
Рассмотрение геометрического смысла результатов последних двух пунктов данного примера мы оставляем читателю в качестве упражнения. ?
Свойства плотности распределения
Плотность распределения неотрицательна, т.е. EMBED Equation.3 при всех х.
Интеграл от плотности распределения на всей числовой прямой равен 1, т.е.
EMBED Equation.3 .
(Данное свойство называется условием нормировки плотности распределения.)
Доказательство. Предположим противное: пусть найдется такой отрезок EMBED Equation.3 , что плотность распределения EMBED Equation.3 отрицательна на этом отрезке. Тогда (см. свойства определенного интеграла) имеем
EMBED Equation.3 EMBED Equation.3
Но, по определению плотности распределения, интеграл, стоящий в левой части последнего неравенства равен EMBED Equation.3 . Так как вероятность события не может быть отрицательной, приходим к противоречию, что доказывает справедливость свойства 1.
По определению плотности распределения,
EMBED Equation.3
Но событие EMBED Equation.3 является достоверным, поэтому его вероятность равна 1. Тем самым доказано свойство 2.
Парадокс нулевой вероятности
Теорема. Для непрерывной случайной величины вероятность принять произвольное числовое значение равно нулю.
Доказательство. Пусть EMBED Equation.3 – произвольное число. События EMBED Equation.3 и EMBED Equation.3 – равны, поэтому, по определению плотности распределения, получаем
EMBED Equation.3
(см. свойства определенного интеграла).
Из парадокса нулевой вероятности вытекает, что для любой непрерывной случайной величины вероятности попадания в произвольный отрезок числовой оси или в соответствующий полуинтервал (интервал) равны между собой, т.е. справедливо
Следствие. Пусть Х непрерывная случайная величина и EMBED Equation.3 – произвольные числа. Тогда верно следующее равенство
EMBED Equation.3
Доказательство. Очевидно, что
EMBED Equation.3
причем события EMBED Equation.3 и EMBED Equation.3 – несовместны. Используя последнее равенство и теорему сложения вероятностей для несовместных событий, получаем
EMBED Equation.3
Но, согласно парадоксу нулевой вероятности, EMBED Equation.3 .Тем самым доказано первое из трех равенств Следствия.
Доказательство оставшихся двух равенств мы оставляем читателю в качестве упражнения.
Функция распределения непрерывной случайной величины
Пусть Х – непрерывная случайная величина и EMBED Equation.3 ? ее плотность распределения. Используя определения функции распределения (см. § 3.4) и плотности распределения, получаем
EMBED Equation.3 .
Обратно, если задана функция распределения непрерывной случайной величины, то (см. теорему об интеграле с переменным верхним пределом) плотность распределения этой случайной величины будет определяться равенством
EMBED Equation.3
Таким образом, имеется два равноправных способа задания непрерывной случайной величины: с помощью или плотности распределения, или функции распределения.
Пример. Пусть плотность распределения непрерывной случайной величины Х имеет вид:
EMBED Equation.3
Найти функцию распределения.
Решение. Пусть EMBED Equation.3 . Тогда
EMBED Equation.3
Если EMBED Equation.3 , то
EMBED Equation.3
Если EMBED Equation.3 , то
EMBED Equation.3
Таким образом, окончательно, искомая функция распределения имеет вид
EMBED Equation.3
(см. рис. 6).
Математическое ожидание и дисперсия непрерывной случайной величины
Рис. 6 у х 1 2 EMBED Equation.3 Формулы для вычисления математического ожидания и дисперсии непрерывной случайной величины аналогичны соответствующим формулам для дискретной случайной величины (см. § 3.3). Действительно, рассмотрим следующую таблицу.
Таким образом, переходя при записи этих формул от дискретной к непрерывной случайной величине, суммирование заменяется интегрированием по всей числовой оси, а вместо вероятности EMBED Equation.3 используется плотность распределения EMBED Equation.3 .
Пример. Функция распределения непрерывной случайной величины Х имеет вид:
EMBED Equation.3
Найти математическое ожидание и дисперсию этой случайной величины.
Решение. Для нахождения EMBED Equation.3 и EMBED Equation.3 нам потребуется плотность распределения данной случайной величины (см. приведенные выше формулы). Получаем:
EMBED Equation.3
или
EMBED Equation.3
Тогда имеем
EMBED Equation.3
Геометрически, полученное значение математического ожидания есть абсцисса центра тяжести фигуры под графиком плотности распределения, т.е. абсцисса прямоугольного треугольника ОАВ (см. рис. 7; напомним, что центр тяжести треугольника есть точка пересечения медиан этого треугольника, а медианы в точке пересечения делятся в отношении 2:1, считая от вершины).
SHAPE \* MERGEFORMAT В А О 1,5 х 3 2 1 EMBED Equation.3 EMBED Equation.3 Рис. 7
Завершая решение, найдем дисперсию рассматриваемой случайной величины.
EMBED Equation.3
EMBED Equation.3
Нормальный закон распределения
Определение. Непрерывная случайная величина имеет нормальный закон распределения с параметрами EMBED Equation.3 и EMBED Equation.3 , если ее плотность распределения имеет вид
EMBED Equation.3
Параметры а и ? нормального закона тесно связаны с параметрами распределения рассматриваемой случайной величины. Справедлива следующая теорема.
Теорема. Пусть случайная величина Х имеет нормальный закон распределения с параметрами а и EMBED Equation.3 . Тогда
EMBED Equation.3
Отметим, что график EMBED Equation.3 – результат деформации Гауссовой кривой EMBED Equation.3 (см. § 2.3). Рассмотрим, как изменяется этот график при изменении параметров а и EMBED Equation.3 нормального закона.
x а EMBED Equation.3 EMBED Equation.3 EMBED Equation.3 Рис. 9 EMBED Equation.3 EMBED Equation.3 x EMBED Equation.3 Рис.8
На рис. 8 изображены графики EMBED Equation.3 при одинаковом значении параметра EMBED Equation.3 : изменение параметра а нормального закона приводит к параллельному переносу графика плотности распределения вдоль оси абсцисс.
На рис. 9 изображены графики EMBED Equation.3 при одинаковом значении параметра а : изменение параметра EMBED Equation.3 нормального закона приводит к “растяжению” графика вдоль оси ординат при сохранении площади под кривой равной 1 (заметим, что на рис. 9 EMBED Equation.3 ).
Теорема. Пусть случайная величина Х имеет нормальный закон распределения с параметрами а и EMBED Equation.3 . Тогда справедливы формулы:
EMBED Equation.3 (1)
EMBED Equation.3 (2)
EMBED Equation.3
где EMBED Equation.3 – функция Лапласа, EMBED Equation.3 – функция распределения случайной величины Х.
Заметим, что график функции распределения EMBED Equation.3 нормально распределенной случайной величины получается в результате деформации из графика функции Лапласа EMBED Equation.3 (см. рис. 10 и 2).
EMBED Equation.3 а y 1 x
Рис. 10 EMBED Equation.3 Пример. Случайная величина Х – ошибка измерительного прибора распределена по нормальному закону с дисперсией равной 16 мк2.
Систематическая ошибка отсутствует. Найти вероятность того, что при одном измерении ошибка:
а) превзойдет по модулю 6 мк;
б) окажется в промежутке от 0,5 до 3,5 мк.
Решение. а) Отсутствие систематической ошибки означает, что значения случайной величины Х группируются около нуля, поэтому EMBED Equation.3 (см. § 3.3). Искомой является вероятность EMBED Equation.3 . Воспользуемся переходом к противоположному событию: EMBED Equation.3 . Так как EMBED Equation.3 ,
то EMBED Equation.3 , т.е. последняя вероятность точно того вида, что может быть вычислена по формуле (2). Используя формулу (2) при EMBED Equation.3 , EMBED Equation.3 , получаем
EMBED Equation.3
Окончательно имеем
EMBED Equation.3 EMBED Equation.3
б) Искомая вероятность вычисляется по формуле (1) при EMBED Equation.3 :
EMBED Equation.3
EMBED Equation.3
Упражнение. Пусть случайная величина Х нормально распределена с параметрами а и ? . Проверить, что EMBED Equation.3 Дать геометрическую интерпретацию этому результату.
Домашнее задание. 3.62, 3.63, 3.65, 3.66.
4.3. Центральная предельная теорема
и теоремы Муавра-Лапласа как следствия из нее
Центральная предельная теорема. Пусть случайные величины EMBED Equation.3 – независимы и одинаково распределены. Тогда закон распределения их суммы EMBED Equation.3 неограниченно приближается к нормальному при неограниченном увеличении числа n эти х случайных величин.
Отметим, что центральная предельная теорема является частным случаем более общего утверждения – теоремы Ляпунова (подробнее см. учебник Н.Ш. Кремера).
Следствие. Биномиальный закон распределения неограниченно приближается к нормальному при неограниченном увеличении параметра n этого закона.
Доказательство. Пусть случайная величина Х – биномиально распределена с параметрами n и p . Рассмотрим сначала тот конкретный пример, когда Х – число наступлений некоторого события А в n повторных независимых испытаниях, в каждом из которых это событие наступает с вероятностью p. Введем в рассмотрение случайные величины EMBED Equation.3 такие, что EMBED Equation.3 – число наступлений события А в i –ом испытании, где EMBED Equation.3 Случайная величина EMBED Equation.3 принимает значение 1, если в i –ом испытании событие А наступило и значение 0 – в противном случае. Сумма случайных величин EMBED Equation.3 принимает значение m тогда и только тогда, когда число Х наступлений события А в n испытаниях равно m., т.е.
EMBED Equation.3 .
Тогда по центральной предельной теореме для случайной величины Х получаем требуемое утверждение. Аналогично данное Следствие доказывается и в общем случае.
Данное Следствие при работе с биномиально распределенными случайными величинами (при достаточно больших n ) позволяет использовать формулы, известные для нормально распределенных случайных величин. Именно это и происходит при применении теорем Муавра-Лапласа. Так, заменяя в формуле (1) из § 4.2 а и EMBED Equation.3 математическим ожиданием и средне квадратическим отклонением биномиально распределенной случайной величины ( EMBED Equation.3 см. § 3.3), обозначая также EMBED Equation.3 , приходим к интегральной теореме Муавра-Лапласа.
Геометрически приближение биномиального распределения к нормальному означает, что с ростом n точки плоскости с координатами EMBED Equation.3 неограниченно приближаются к кривой EMBED Equation.3 плотности нормального закона (здесь m – неотрицательное целое, не превосходящее n, значение EMBED Equation.3 вычисляется по формуле Бернулли; см. рис. 11).
EMBED Equation.3 EMBED Equation.3 m EMBED Equation.3 у х Рис.11 Тогда справедливо приближенное равенство
EMBED Equation.3
где EMBED Equation.3 , которое, записанное явно, и есть локальная теорема Муавра-Лапласа.
Тема 5. Двумерные случайные величины
5.1. Совместные распределения и их параметры
Определение. Вектор EMBED Equation.3 , компоненты Х и Y которого являются случайными величинами, называется случайным вектором или двумерной случайной величиной.
Пример. Пусть Х – рост человека, Y – вес человека. Тогда EMBED Equation.3 – (непрерывная) двумерная случайная величина.
Пример. Пусть Х и Y – числа попаданий в мишень первого и второго стрелков (соответственно). Тогда EMBED Equation.3 – (дискретная) двумерная случайная величина.
Сравнивая между собой одномерную (см. выше темы 3, 4) и двумерную случайные величины, заметим, что, если результат измерения первой – точка на прямой, то результат измерения второй – точка плоскости.
Определение. Закон распределения одной из переменных при фиксированном значении другой называется условным распределением.
Определение. Связь между переменными называется статистической, если каждому значению одной переменной ставится в соответствие условное распределение другой переменной.
Отметим, что задание двумерной случайной величины равносильно заданию статистической связи между переменными.
Рассмотрим сначала двумерную дискретную случайную величину.
По аналогии с одномерным случаем, закон распределения двумерной дискретной случайной величины задается с помощью таблицы вида:
где
EMBED Equation.3
EMBED Equation.3
По аналогии с основным свойством закона распределения одномерной случайной величины, справедливо равенство
EMBED Equation.3
Приведенная таблица называется совместным законом распределения случайных величин Х и Y.
Пример #. Совместный закон распределения случайных величин Х и Y имеет вид:
Найти математическое ожидание случайной величины Х.
Решение. Прежде всего найдем закон распределения случайной величины Х. Так как
EMBED Equation.3
EMBED Equation.3
то закон распределения Х имеет вид:
Тогда
EMBED Equation.3
Оставляем читателю в качестве упражнения проверку того, что закон распределения случайной величины Y имеет вид:
и EMBED Equation.3
Определение. Связь между переменными называется функциональной, если каждому значению из области определения одной переменной поставлено в соответствие однозначно определенное значение другой переменной.
Примерами такого вида связи изобилует курс математического анализа: EMBED Equation.3
EMBED Equation.3 , EMBED Equation.3 EMBED Equation.3 и т.д. и т.д.
Определение. Функциональная связь между значениями одной переменной и условными математическими ожиданиями другой переменной называется корреляционной.
Определение. График корреляционной зависимости называется линией регрессии.
Корреляционные зависимости бывают двух видов ( EMBED Equation.3 по EMBED Equation.3 и EMBED Equation.3 по EMBED Equation.3 ) в зависимости от того, которая из переменных выполняет роль аргумента: EMBED Equation.3 или EMBED Equation.3 . Соответственно, EMBED Equation.3 – точки корреляционной зависимости EMBED Equation.3 по EMBED Equation.3 и EMBED Equation.3 – точки корреляционной зависимости EMBED Equation.3 по EMBED Equation.3 .
Пример. По совместному закону распределения из предыдущего примера (Пример #) найти корреляционную зависимость EMBED Equation.3 по EMBED Equation.3 .
Решение. Применяя теорему умножения вероятностей, получаем
EMBED Equation.3
EMBED Equation.3 EMBED Equation.3
где вероятности, стоящие в числителях последних дробей, берутся из таблицы совместного закона распределения Примера #, вероятность EMBED Equation.3 найдена в том же примере. Таким образом, условное распределение случайной величины Y при EMBED Equation.3 имеет вид:
По этому закону распределения находим условное математическое ожидание:
EMBED Equation.3 .
Аналогично получаем:
EMBED Equation.3
Собирая вместе полученные результаты, запишем корреляционную зависимость EMBED Equation.3 по EMBED Equation.3 в виде следующей таблицы:
Упражнение. По совместному распределения Примера # убедиться, что корреляционная зависимость EMBED Equation.3 по EMBED Equation.3 имеет вид:
Рассмотрим теперь непрерывную двумерную случайную величину.
Определение. Функция EMBED Equation.3 называется плотностью распределения непрерывной двумерной случайной величины EMBED Equation.3 , если для произвольных чисел EMBED Equation.3
( EMBED Equation.3 ) вероятность того, что в произвольном испытании значение случайной величины Z попадает в прямоугольник EMBED Equation.3 EMBED Equation.3 вычисляется по формуле
EMBED Equation.3
Условные плотности распределения определяются формулами:
EMBED Equation.3 EMBED Equation.3
Соответственно, условные математические ожидания тогда вычисляются по формулам:
EMBED Equation.3 EMBED Equation.3
Коэффициент корреляции и его свойства
Определение. Коэффициентом корреляции EMBED Equation.3 случайных величин Х и Y называется число, определяемое равенством
EMBED Equation.3
где EMBED Equation.3 EMBED Equation.3
Коэффициент корреляции является мерой тесноты линейной связи между переменными.
Величина EMBED Equation.3 называется ковариацией и обозначается EMBED Equation.3 .
Замечание. Из свойства математического ожидания (см. § 3.3) следует, что, если случайные величины Х и Y независимы, то коэффициент корреляции EMBED Equation.3 равен нулю. Существенно, что обратное утверждение неверно, т.е. в общем случае из условия равенства коэффициента корреляции нулю не следует, что данные случайные величины независимы.
Упражнение. Совместное распределение случайных величин X иY имеет вид:
Убедиться, что EMBED Equation.3 и данные случайные величины независимы.
Упражнение. По совместному распределению Примера # вычислить коэффициент корреляции. (Ответ. EMBED Equation.3 )
Упражнение. Совместное распределение величин X иY имеет вид:
Убедиться, что EMBED Equation.3 , но данные случайные величины – зависимы (более того, можно заметить, что в данном случае X иY связаны наиболее “жесткой” из всех возможных связей – функциональной: EMBED Equation.3 ).
Теорема (Область возможных значений коэффициента корреляции). Модуль коэффициента корреляции не превосходит1, т.е.
EMBED Equation.DSMT4
Теорема. Если модуль коэффициента корреляции двух случайных величин равен 1, то между этими случайными величинами существует линейная функциональная зависимость.
Пример. Пусть совместный закон распределения случайных величин X иY имеет вид:
Тогда EMBED Equation.DSMT4 Оставляем читателю в качестве упражнения проверку того, что в данном случае EMBED Equation.DSMT4
Из определения ковариации следует, что
EMBED Equation.DSMT4
Другими словами, ковариация является мерой неравенства между математическим ожиданием произведения двух случайных величин и произведением их математических ожиданий. Аналогично, применительно к дисперсии, справедливо равенство
EMBED Equation.DSMT4
Двумерный нормальный закон распределения
Определение. Случайная величина EMBED Equation.DSMT4 называется распределенной по двумерному нормальному закону с параметрами EMBED Equation.DSMT4 , если ее плотность распределения имеет вид:
EMBED Equation.DSMT4 ,
где
EMBED Equation.DSMT4
Теорема. Пусть двумерная случайная величина EMBED Equation.DSMT4 имеет двумерный нормальный закон распределения. Тогда корреляционные зависимости между X и Y – линейны:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
где EMBED Equation.DSMT4 EMBED Equation.DSMT4
Это важное свойство двумерного нормального закона будет использовано нами позже при рассмотрении теории корреляции.
Тема 6. Закон больших чисел
6.1. Неравенство Чебышёва
Лемма Чебышёва. Пусть среди значений случайной величины EMBED Equation.DSMT4 нет отрицательных. Тогда вероятность того, что в некотором испытании значение этой случайной величины превысит число EMBED Equation.DSMT4 , оценивается по формуле
EMBED Equation.DSMT4
Так как события EMBED Equation.DSMT4 и EMBED Equation.DSMT4 взаимно противоположны, то EMBED Equation.DSMT4 и лемма Чебышёва может быть также представлена в виде
EMBED Equation.DSMT4
Пример. В среднем в течение часа на вокзал прибывает 400 пассажиров. Оценить:
а) вероятность того, что число пассажиров, прибывших на вокзал в течение часа, будет более 420;
б) верхнюю границу для числа прибывших пассажиров, которую можно гарантировать с вероятностью не меньшей 0,9.
Решение. Пусть EMBED Equation.DSMT4 – число пассажиров, прибывающих на вокзал в течение наудачу выбранного часа. По условию, значения этой случайной величины группируются около 400. Тем самым, имеем EMBED Equation.DSMT4 Полагая в неравенстве Чебышёва EMBED Equation.DSMT4 получаем
EMBED Equation.DSMT4
Из условия и второй формы записи неравенства Чебышёва следует, что
EMBED Equation.DSMT4
где EMBED Equation.DSMT4 – искомая верхняя граница для числа пассажиров. Таким образом, имеем равенство
EMBED Equation.DSMT4
Решая это уравнение относительно EMBED Equation.DSMT4 , получаем: EMBED Equation.DSMT4
Неравенство Чебышёва. Для произвольной случайной величины EMBED Equation.DSMT4 вероятность того, что в некотором испытании значение этой случайной величины будет отличаться от математического ожидания EMBED Equation.DSMT4 не более чем на EMBED Equation.DSMT4 (по абсолютной величине), оценивается по формуле
EMBED Equation.DSMT4
где EMBED Equation.DSMT4 – произвольное положительное число.
Рассмотрим следствия из неравенства Чебышёва.
Следствие 1. Пусть случайные величины EMBED Equation.DSMT4 – независимы, EMBED Equation.DSMT4 , EMBED Equation.DSMT4 где EMBED Equation.DSMT4 EMBED Equation.DSMT4 – некоторое число. Тогда вероятность того, что среднее арифметическое этих случайных величин отличается от среднего арифметического их математических ожиданий не более чем на EMBED Equation.DSMT4 (по абсолютной величине), оценивается по формуле
EMBED Equation.DSMT4
Следствие 2. Пусть случайные величины EMBED Equation.DSMT4 – независимы, EMBED Equation.DSMT4 , EMBED Equation.DSMT4 где EMBED Equation.DSMT4 Тогда вероятность того, что среднее арифметическое этих случайных величин отличается от их общего математического ожидания не более чем на EMBED Equation.DSMT4 (по абсолютной величине), оценивается по формуле
EMBED Equation.DSMT4
Следствие 3. Пусть EMBED Equation.DSMT4 – число наступлений некоторого события EMBED Equation.DSMT4 в EMBED Equation.DSMT4 повторных независимых испытаниях, в каждом из которых это событие наступает с вероятностью EMBED Equation.DSMT4 . Тогда вероятность того, что число EMBED Equation.DSMT4 наступлений события EMBED Equation.DSMT4 отличается от EMBED Equation.DSMT4 не более чем на EMBED Equation.DSMT4 (по абсолютной величине), оценивается по формуле
EMBED Equation.DSMT4
Следствие 4. Пусть EMBED Equation.DSMT4 – число наступлений некоторого события EMBED Equation.DSMT4 в EMBED Equation.DSMT4 повторных независимых испытаниях, в каждом из которых это событие наступает с вероятностью EMBED Equation.DSMT4 . Тогда вероятность того, что частость EMBED Equation.DSMT4 наступлений события EMBED Equation.DSMT4 отличается от вероятности EMBED Equation.DSMT4 не более чем на EMBED Equation.DSMT4 (по абсолютной величине), оценивается по формуле
EMBED Equation.DSMT4
Последнее следствие называется также неравенством Бернулли.
Пример. Вероятность сделать покупку для каждого из покупателей магазина равна 0,7. Почему нельзя применить неравенство Чебышёва для оценки вероятности того, что из 1000 покупателей доля таких, которые приобретут в магазине товар, будет заключена в границах от 0,67 до 0,72? Как следует изменить левую границу, чтобы применение неравенства Чебышёва стало возможным? Решить задачу при соответствующем изменении левой границы. Найти эту же вероятность по интегральной теореме Муавра-Лапласа. Объяснить различие в полученных результатах. Сколько покупателей надо обследовать, чтобы те же границы для рассматриваемой доли можно было гарантировать с вероятностью не меньшей 0,9?
Решение. Неравенство Чебышёва позволяет оценивать вероятности попадания значения случайной величины только в границы, которые симметричны относительно математического ожидания этой случайной величины. Но в данном случае интервал (0,67; 0,72) несимметричен относительно EMBED Equation.DSMT4 , где EMBED Equation.DSMT4 – доля покупателей, которые приобретут в магазине товар, EMBED Equation.DSMT4 – вероятность приобретения товара. Соответственно, для того, чтобы применение неравенства Чебышёва стало возможным, левая граница интервала должна отстоять от EMBED Equation.DSMT4 ровно настолько, насколько отстоит правая, т.е. на EMBED Equation.DSMT4 Неравенства EMBED Equation.DSMT4 и EMBED Equation.DSMT4 – равносильны, а вероятность EMBED Equation.DSMT4 оценивается по следствию 4 (неравенству Бернулли) при EMBED Equation.DSMT4 , EMBED Equation.DSMT4 , EMBED Equation.DSMT4 EMBED Equation.DSMT4 :
EMBED Equation.DSMT4
Точно такая же вероятность может быть найдена по следствию 2 из интегральной теореме Муавра-Лапласа:
EMBED Equation.DSMT4
Очевидно, что полученные результаты не противоречат друг другу. Поясним, почему для одной и той же вероятности неравенство Чебышёва дает лишь оценку, в то время как теорема Муавра-Лапласа – точное значение. Дело в том, что неравенство Чебышёва получено без каких бы то ни было предположений о законе распределения рассматриваемой случайной величины. В результате область его применений широка, но получение точных результатов с его помощью оказывается невозможным. В свою очередь, теорема Муавра-Лапласа опирается на свойство биномиального распределения: по центральной предельной теореме, это распределение неограниченно приближается к нормальному при неограниченном увеличении числа испытаний. Использование закона распределения рассматриваемой случайной величины и позволяет уточнить окончательный результат.
Перейдем теперь к последнему заданию данной задачи. По условию и неравенству Бернулли, имеем
EMBED Equation.DSMT4
причем EMBED Equation.DSMT4 EMBED Equation.DSMT4 EMBED Equation.DSMT4 . Тогда полученное равенство
EMBED Equation.DSMT4
содержит единственную неизвестную: EMBED Equation.DSMT4 . Решая это уравнение относительно этой неизвестной, получаем:
EMBED Equation.DSMT4
6.2. Теоремы Бернулли и Чебышёва
Теорема Бернулли. Пусть EMBED Equation.DSMT4 – частость наступления события А в EMBED Equation.DSMT4 повторных независимых испытаниях, в каждом из которых это событие наступает с вероятностью EMBED Equation.DSMT4 .Тогда для произвольного EMBED Equation.DSMT4 вероятность того, что частость EMBED Equation.DSMT4 будет отличаться от вероятности EMBED Equation.DSMT4 не более чем на EMBED Equation.DSMT4 (по абсолютной величине) неограниченно приближается к 1 при неограниченном увеличении значения EMBED Equation.DSMT4 , т.е.
EMBED Equation.DSMT4
Другими словами, теорема Бернулли утверждает, что частость EMBED Equation.DSMT4 наступления некоторого события сходится по вероятности к вероятности EMBED Equation.DSMT4 наступления этого события.
Доказательство. Учитывая, что вероятность произвольного события не превосходит 1, из неравенства Бернулли следует
EMBED Equation.DSMT4
Переходя к пределу при EMBED Equation.DSMT4 , получаем
EMBED Equation.DSMT4
Крайние левый и правый пределы этого двойного неравенства равны 1. Таким образом, имеем
EMBED Equation.DSMT4
что равносильно утверждению теоремы Бернулли.
Теорема Бернулли утверждает, что, если за значение вероятности EMBED Equation.DSMT4 некоторого события взять значение частости EMBED Equation.DSMT4 наступления этого события, найденную по результатам EMBED Equation.DSMT4 испытаний, то вероятность погрешности (даже сколь угодно малой) приближенного равенства EMBED Equation.DSMT4 будет стремиться к нулю с увеличением числа испытаний EMBED Equation.DSMT4 .
Теорема Чебышёва. Пусть случайные величины EMBED Equation.DSMT4 независимы, одинаково распределены и EMBED Equation.DSMT4 Тогда для произвольного EMBED Equation.DSMT4 вероятность того, что среднее арифметическое этих случайных величин отличается от их общего математического ожидания не более чем на EMBED Equation.DSMT4 (по абсолютной величине) , неограниченно приближается к 1 при неограниченном увеличении числа EMBED Equation.DSMT4 этих случайных величин т.е.
EMBED Equation.DSMT4
Другими словами, теорема Чебышёва утверждает, что среднее арифметическое некоторого числа случайных величин, имеющих одинаковое математическое ожидание, сходится по вероятности к их общему математическому ожиданию.
Говоря о приложениях теоремы Чебышёва, отметим, в первую очередь, следующую возможность. Если за значение некоторого неизвестного параметра а взять среднее арифметическое результатов EMBED Equation.DSMT4 независимых измерений этого параметра, то вероятность погрешности (даже сколь угодно малой) приближенного равенства EMBED Equation.DSMT4 будет стремиться к нулю при неограниченном увеличении числа EMBED Equation.DSMT4 этих измерений.
Теоремы Бернулли и Чебышёва являются явными реализациями так называемого закона больших чисел, утверждающего, что при проведении достаточно большого числа испытаний погрешности отдельных испытаний взаимно погашают друг друга (тем самым среднее арифметическое независимых случайных величин – результатов этих испытаний – стремится к постоянной величине при неограниченном увеличении числа испытаний).
Домашнее задание: 6.10, 6.11, 6.17, 6.19, 6.22.
Математическая статистика
Тема 7. Выборочный метод
7.1. Оценка неизвестного параметра. Свойства оценок
Определение. Случайная величина EMBED Equation.DSMT4 называется оценкой неизвестного параметра EMBED Equation.DSMT4 , если значение этой случайной величины, найденное по результатам серии из EMBED Equation.DSMT4 измерений, может быть принято за приближенное значение этого параметра т.е. если справедливо равенство EMBED Equation.DSMT4 .
Пример. Если в качестве неизвестного параметра рассматривается вероятность EMBED Equation.DSMT4 наступления некоторого события EMBED Equation.DSMT4 , то оценкой этого параметра служит частость EMBED Equation.DSMT4 наступлений события EMBED Equation.DSMT4 в EMBED Equation.DSMT4 независимых испытаниях (см. статистическое определение вероятности и теорему Бернулли).
Пример. Пусть случайные величины EMBED Equation.DSMT4 имеют одинаковое математическое ожидание, т.е. EMBED Equation.DSMT4 . Тогда оценкой значения EMBED Equation.DSMT4 общего математического ожидания таких случайных величин служит среднее арифметическое EMBED Equation.DSMT4 этих случайных величин. Важным частным случаем рассмотренной ситуации является следующий
Пример. Оценкой некоторого параметра EMBED Equation.DSMT4 служит среднее арифметическое EMBED Equation.DSMT4 результатов EMBED Equation.DSMT4 независимых измерений этого параметра (см. теорему Чебышёва).
При непосредственном использовании приближенного равенства EMBED Equation.DSMT4 говорят о точечном оценивании неизвестного параметра.
Возможно также интервальное оценивание неизвестного параметра. Для того, чтобы объяснить, в чем оно состоит, введем в рассмотрение следующие понятия.
Определение. Для произвольного EMBED Equation.DSMT4 интервал EMBED Equation.DSMT4 называется доверительным интервалом; сама величина EMBED Equation.DSMT4 называется в этом случае предельной ошибкой выборки.
Определение. Вероятность того, что неизвестное значение оцениваемого параметра накрывается доверительным интервалом, называется доверительной вероятностью.
Таким образом, если EMBED Equation.DSMT4 – оценка параметра EMBED Equation.DSMT4 , то
EMBED Equation.DSMT4
– доверительная вероятность (мы предполагаем, что оценка EMBED Equation.DSMT4 является непрерывной случайной величиной).
Интервальное оценивание состоит, например, в вычислении доверительной вероятности для заданной предельной ошибки выборки.
Решение задачи интервального оценивания связано с определением характера закона распределения используемой оценки EMBED Equation.DSMT4 .
Рассмотрим теперь некоторые свойства оценок.
Определение. Оценка EMBED Equation.DSMT4 параметра EMBED Equation.DSMT4 называется несмещенной, если математическое ожидание этой оценки равно оцениваемому параметру, т.е.
EMBED Equation.DSMT4
Определение. Оценка EMBED Equation.DSMT4 параметра EMBED Equation.DSMT4 называется состоятельной, если для произвольного EMBED Equation.DSMT4 выполняется следующее предельное соотношение
EMBED Equation.DSMT4
Другими словами, оценка EMBED Equation.DSMT4 параметра EMBED Equation.DSMT4 состоятельна, если эта оценка сходится по вероятности к данному параметру. (Напомним, что примеры сходимости такого рода дают теоремы Бернулли и Чебышёва, см. § 6.2.)
Определение. Несмещенная оценка некоторого параметра называется эффективной, если она обладает наименьшей дисперсией среди всех несмещенных оценок, найденных по выборке заданного объема.
Пример. Частость EMBED Equation.DSMT4 наступления некоторого события является несмещенной, состоятельной и эффективной оценкой вероятности EMBED Equation.DSMT4 этого события. Заметим, что свойства несмещенности и состоятельности частости были фактически рассмотрены нами ранее в несколько ином контексте. Действительно, несмещенность частости – равенство EMBED Equation.DSMT4 – является одним из свойств биномиально распределенной случайной величины (см. § 3.3). Состоятельность частости утверждается теоремой Бернулли (см. § 6.2).
Пример. Среднее арифметическое некоторого числа независимых и одинаково распределенных случайных величин является несмещенной и состоятельной оценкой общего математического ожидания этих случайных величин. Действительно, несмещенность – есть свойство 5 математического ожидания (см. § 3.3). Состоятельность утверждается теоремой Чебышёва (см. § 6.2).
7.2. Первичная обработка результатов эксперимента. Характеристики вариационных рядов
Пусть произведено EMBED Equation.DSMT4 независимых измерений некоторой случайной величины EMBED Equation.DSMT4 : EMBED Equation.DSMT4 – результат первого измерения, EMBED Equation.DSMT4 – результат второго измерения, … , EMBED Equation.DSMT4 – результат EMBED Equation.DSMT4 -го измерения. Тогда через EMBED Equation.DSMT4 обозначим среднее арифметическое результатов EMBED Equation.DSMT4 измерений рассматриваемой случайной величины EMBED Equation.DSMT4 , то есть
EMBED Equation.DSMT4 .
Заметим, что, поскольку EMBED Equation.DSMT4 – случайные величины, то EMBED Equation.DSMT4 также является случайной величиной.
Пример. Детали некоторого вида расфасованы по ящикам. Результаты обследования шести из этих ящиков (на предмет наличия в них бракованных деталей) представлены в таблице:
где EMBED Equation.DSMT4 – номер ящика, EMBED Equation.DSMT4 – число бракованных деталей в EMBED Equation.DSMT4 -ом ящике.
Тогда
EMBED Equation.DSMT4
Приведенное вычисление подсказывает возможность более компактного представления результатов обследования, а именно – использование таблицы следующего вида:
где EMBED Equation.DSMT4 – число бракованных деталей в ящике; EMBED Equation.DSMT4 – число ящиков.
Такая таблица называется вариационным рядом. Аналогично, в общем случае имеем
Определение. Вариационным рядом признака EMBED Equation.DSMT4 называется таблица вида
где EMBED Equation.DSMT4 – возможные значения данного признака, EMBED Equation.DSMT4 – числа объектов, EMBED Equation.DSMT4 , EMBED Equation.DSMT4 – число обследованных объектов ( EMBED Equation.DSMT4 ).
Отметим, что величины EMBED Equation.DSMT4 , значения которых заполняют нижнюю строку вариационного ряда, называются эмпирическими частотами.
Очевидно, что признак EMBED Equation.DSMT4 , для которого строится вариационный ряд, есть случайная величина.
В том случае, когда результаты обследования представлены вариационным рядом, формула для вычисления EMBED Equation.DSMT4 имеет вид
EMBED Equation.DSMT4 (1)
Сама величина EMBED Equation.DSMT4 в этом случае называется средней вариационного ряда или выборочной средней. Появление в данном случае дополнительного эпитета выборочный связано с тем, что обследованные объекты выбираются из некоторой объемлющей (так называемой генеральной) совокупности объектов.
Напомним, что EMBED Equation.DSMT4 есть случайная величина. В тех случаях, когда данные эксперимента представлены вариационным рядом, а EMBED Equation.DSMT4 вычисляется по формуле (1), случайными являются эмпирические частоты EMBED Equation.DSMT4 .
Вариационный ряд является оценкой закона распределения случайной величины (признака) EMBED Equation.DSMT4 . Поясним, почему это так. По вариационному ряду построим равнозначную ему таблицу, заменяя строку эмпирических частот EMBED Equation.DSMT4 частостями EMBED Equation.DSMT4 . В результате имеем:
Учитывая, что частости EMBED Equation.DSMT4 являются оценками вероятностей EMBED Equation.DSMT4 ( EMBED Equation.DSMT4 , см. § 7.1), приходим к требуемому утверждению.
Принимая во внимание последнее замечание, получаем
EMBED Equation.DSMT4 .
Таким образом, средняя вариационного ряда (выборочная средняя) EMBED Equation.DSMT4 является оценкой математического ожидания EMBED Equation.DSMT4 той случайной величины (признака) EMBED Equation.DSMT4 , для которой построен данный вариационный ряд. Можно доказать, что эта оценка является несмещенной и состоятельной.
Учитывая полученные результаты, аналогично построим оценку для дисперсии EMBED Equation.DSMT4 случайной величины EMBED Equation.DSMT4 :
EMBED Equation.DSMT4
Выражение, стоящее в правой части последнего равенства называется выборочной дисперсией и обозначается EMBED Equation.DSMT4 , то есть
EMBED Equation.DSMT4
Выборочная дисперсия EMBED Equation.DSMT4 – оценка для дисперсии EMBED Equation.DSMT4 случайной величины EMBED Equation.DSMT4 . Можно доказать, что выборочная дисперсия EMBED Equation.DSMT4 является смещенной оценкой для EMBED Equation.DSMT4 , то есть EMBED Equation.DSMT4 Несмещенная оценка EMBED Equation.DSMT4 для EMBED Equation.DSMT4 определяется равенством
EMBED Equation.DSMT4
Заметим, что для вычисления выборочной дисперсии удобно использовать формулу – аналог свойства 3 дисперсии (см. § 3.3):
EMBED Equation.DSMT4
Определение. Вариационный ряд называется дискретным, если число возможных значений признака – конечно, и непрерывным (интервальным), если возможные значения признака полностью заполняют некоторый интервал.
Вариационные ряды, которые встречались нам до сих пор в данном параграфе, являются дискретными. Рассмотрим пример интервального вариационного ряда.
Пример. По результатам обследования некоторого малого предприятия получены следующие данные о ежемесячной заработной плате его сотрудников:
где EMBED Equation.DSMT4 – размер заработной платы (ден. ед.), EMBED Equation.DSMT4 – число сотрудников.
Для нахождения параметров непрерывного вариационного ряда – выборочной средней, выборочной дисперсии – этот вариационный ряд сначала сводится к дискретному (в результате выбора середины для каждого из рассматриваемых интервалов), после чего EMBED Equation.DSMT4 и EMBED Equation.DSMT4 вычисляются по приведенным выше формулам.
Например, данный интервальный вариационный ряд сводится к следующему дискретному:
Тогда
EMBED Equation.DSMT4
EMBED Equation.DSMT4
или
EMBED Equation.DSMT4
EMBED Equation.DSMT4
7.3. Сплошное и выборочное наблюдения
Пусть дана некоторая (генеральная) совокупность объектов и требуется оценить значение некоторого параметра этой совокупности (например, среднее значение прибыли для малых предприятий некоторого региона или долю выборщиков, проголосовавших за данного кандидата на выборах).
Предположим, что от полного обследования всей генеральной совокупности решили отказаться. Среди возможных причин здесь можно указать разрушение объекта в результате обследования (в том случае, когда, например, требуется узнать средний срок службы лампочек в партии, изготовленной на некотором заводе, полное обследование, конечно, даст исчерпывающую информацию, но сама совокупность перестанет существовать). Другая возможная причина – высокая стоимость полного обследования или его чрезмерная продолжительность (например, выводы экспресс-анализа результатов голосования на некоторых выборах требуется получить в кротчайшие сроки, что невозможно при тотальном обследовании). Наконец, генеральная совокупность может обладать таким свойством как «необозримость» (например, рыба некоторого вида в данном море).
Тогда из генеральной совокупности выделяют часть (выборку). Обследуя ее, находят значение исследуемого параметра в выборке. На основании этих результатов делают вывод о значении этого параметра во всей генеральной совокупности (см. ниже §§ 7.4, 7.5).
Среди основных принципов выборочного метода следует отметить случайность и массовость. В самом деле, объекты в выборку следует отбирать случайным образом, в противном случае объективных данных о генеральной совокупности не получить. Также, следует постараться взять в выборку так много объектов как возможно, поскольку малая выборка будет плохо отражать свойства всей генеральной совокупности.
Определение. Ошибкой репрезентативности называется ошибка, связанная с тем, что не все объекты генеральной совокупности попадут в выборку (и, тем самым, будут обследованы).
Заметим, что ошибка репрезентативности выборочного метода принципиально неустранима.
В зависимости от способа формирования, выборки бывают собственно-случайные, механические, типические, серийные (подробнее см. учебник Н.Ш. Кремера). В дальнейшем мы будем рассматривать лишь собственно-случайные выборки, которые составляются следующим образом:
Предположим, что объекты генеральной совокупности некоторым образом перенумерованы. Из полной совокупности номеров случайным образом отбирают столько номеров, сколько элементов должно быть в выборке. Элементы генеральной совокупности с такими номерами и подвергаются обследованию.
Выборка называется повторной, если перед отбором очередного номера из полной совокупности номеров предыдущий номер возвращается назад в совокупность; в противном случае – бесповторной.
В данном курсе мы рассмотрим следующие из задач выборочного метода:
– оценка неизвестного значения генерального среднего (см. § 7.4);
– оценка неизвестного значения генеральной доли (см. § 7.5).
7.4. Оценка генеральной средней
Пусть задана генеральная совокупность объектов, для которой фиксирован некоторой числовой признак EMBED Equation.DSMT4 . Требуется оценить среднее значение признака EMBED Equation.DSMT4 в генеральной совокупности – генеральную среднюю EMBED Equation.DSMT4 . Для этого из генеральной совокупности выделяют часть (выборку), и по результатам ее обследования находят среднее значение признака EMBED Equation.DSMT4 в выборке – выборочную среднюю EMBED Equation.DSMT4 , с помощью которой и выполняют оценивание неизвестного значения EMBED Equation.DSMT4 . Другими словами, выборочная средняя EMBED Equation.DSMT4 является оценкой генерального среднего EMBED Equation.DSMT4 .
Пример. Пусть некоторая совокупность деталей обследуется на предмет их длины. Тогда EMBED Equation.DSMT4 – средняя длина деталей в генеральной совокупности, EMBED Equation.DSMT4 – средняя длина деталей в выборке, EMBED Equation.DSMT4 – длина детали, взятой наудачу из генеральной совокупности.
В том случае, когда оценивание сводится к использованию приближенного равенства EMBED Equation.DSMT4 , говорят о точечном оценивании генеральной средней (см. § 7.1).
Возможно также интервальное оценивание генеральной средней (см. § 7.1). Для того чтобы объяснить, в чем оно состоит, введем в рассмотрение следующие понятия.
Определение. Для произвольного EMBED Equation.DSMT4 интервал EMBED Equation.DSMT4 называется доверительным интервалом; величина EMBED Equation.DSMT4 называется в этом случае предельной ошибкой выборки.
Определение. Вероятность того, что неизвестное значение генеральной средней EMBED Equation.DSMT4 накрывается доверительным интервалом, называется доверительной вероятностью.
Таким образом,
EMBED Equation.DSMT4
– доверительная вероятность.
Интервальное оценивание состоит, например, в вычислении доверительной вероятности для заданной предельной ошибке выборки.
Как и всякая оценка, выборочная средняя EMBED Equation.DSMT4 является случайной величиной. Действительно, элементы выборки отбираются из генеральной совокупности случайным образом, а значение EMBED Equation.DSMT4 зависит от того, какие именно элементы попали в выборку. Рассмотрим свойства выборочной средней EMBED Equation.DSMT4 как случайной величины.
Теорема 1. Математическое ожидание выборочной средней EMBED Equation.DSMT4 равно генеральной средней EMBED Equation.DSMT4 , то есть
EMBED Equation.DSMT4
Среднее квадратическое отклонение EMBED Equation.DSMT4 EMBED Equation.DSMT4 выборочной средней вычисляется по формулам
EMBED Equation.DSMT4
– в случае повторной выборки и
EMBED Equation.DSMT4
– в случае бесповторной,
где EMBED Equation.DSMT4 – объем выборки, EMBED Equation.DSMT4 – объем генеральной совокупности, EMBED Equation.DSMT4 – дисперсия признака EMBED Equation.DSMT4 для рассматриваемой генеральной совокупности (генеральная дисперсия).
Напомним, что, по определению среднего квадратического отклонения, EMBED Equation.DSMT4 равно корню квадратному из дисперсии выборочной средней, то есть
EMBED Equation.DSMT4
(аналогично в случае бесповторной выборки).
Замечание. При применении на практике формул Теоремы 1 полагают, что
EMBED Equation.DSMT4 .
Теорема 2. Закон распределения выборочной средней неограниченно приближается к нормальному при неограниченном увеличении объёма выборки.
Согласно результатам § 4.3, для произвольной нормально распределенной случайной величины EMBED Equation.DSMT4 справедлива формула
EMBED Equation.DSMT4 .
Учитывая Теорему 2, в последнем равенстве положим EMBED Equation.DSMT4 . Тогда, по Теореме 1, EMBED Equation.DSMT4 и EMBED Equation.DSMT4 , и приведенная формула – свойство нормального закона распределения принимает вид:
EMBED Equation.DSMT4 .
Вероятность, стоящая в левой части последнего равенства называется доверительной вероятностью (см. выше), поэтому сама эта формула называется формулой доверительной вероятности.
Теорема 3. Выборочная средняя EMBED Equation.DSMT4 является несмещенной и состоятельной оценкой генеральной средней EMBED Equation.DSMT4 .
Пример. Для обследования средней заработной платы трехсот рабочих была образована выборка, состоящая из пятидесяти рабочих. Результаты выборочного обследования представлены в таблице:
Найти вероятность того, что средняя заработная плата всех рабочих отличается от средней выборочной не более чем на 5 ден. ед. (по абсолютной величине) в случае повторной и бесповторной выборок.
Найти границы, в которых с вероятностью 0,9545 заключена средняя заработная плата всех рабочих.
Сколько рабочих надо взять в выборку, чтобы полученные в п. 2 доверительные границы можно было гарантировать с вероятностью 0,9973.
Решение. Исходный вариационный ряд является интервальным. Для нахождения его характеристик, прежде всего, сведем этот вариационный ряд к дискретному:
где EMBED Equation.DSMT4 – возможное значение заработной платы – середина EMBED Equation.DSMT4 - го интервала исходного вариационного ряда (ден. ед.); EMBED Equation.DSMT4 – число рабочих; EMBED Equation.DSMT4 .
EMBED Equation.DSMT4
EMBED Equation.DSMT4 .
EMBED Equation.DSMT4
EMBED Equation.DSMT4 .
EMBED Equation.DSMT4
Для нахождения доверительной вероятности (см. п. 1 задания) воспользуемся одноименной формулой при EMBED Equation.DSMT4 . Но сначала вычислим средние квадратические отклонения выборочной средней для каждого из рассматриваемых типов выборок.
а) Повторная выборка.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
б) Бесповторная выборка, EMBED Equation.DSMT4 .
EMBED Equation.DSMT4 .
EMBED Equation.DSMT4 .
Доверительный интервал в данном случае: EMBED Equation.DSMT4 .
Тем самым получаем, что: неизвестное значение средней заработной платы всех рабочих накрывается интервалом (146,6;156,6) с вероятностью 0,8557 в случае повторной выборки и с вероятностью 0,89 в случае бесповторной выборки.
В п. 2 задания искомым является доверительный интервал, для нахождения которого следует вычислить предельную ошибку выборки EMBED Equation.DSMT4 . Из условия и формулы доверительной вероятности в случае повторной выборки следует, что
EMBED Equation.DSMT4 .
По таблице значений функции Лапласа найдем такое значение EMBED Equation.DSMT4 , что EMBED Equation.DSMT4 . Имеем EMBED Equation.DSMT4 . Поскольку
EMBED Equation.DSMT4 ,
то
EMBED Equation.DSMT4 .
Соответствующий доверительный интервал:
EMBED Equation.DSMT4 .
Аналогично, в случае бесповторной выборки имеем
EMBED Equation.DSMT4 .
Соответствующий доверительный интервал:
EMBED Equation.DSMT4 .
Таким образом, неизвестное значение средней заработной платы всех рабочих с вероятностью 0,9545 накрывается доверительным интервалом (144,73; 158,47) в случае повторной выборки и доверительным интервалом (145,33; 157,87) в случае бесповторной выборки.
При решении п. 3 задания будем считать известными приближенные значения выборочной средней EMBED Equation.DSMT4 и выборочной дисперсии EMBED Equation.DSMT4 . Также используем предельные ошибки выборки EMBED Equation.DSMT4 , найденные в п. 2. Рассмотрим сначала случай повторной выборки.
Из условия и формулы доверительной вероятности следует, что
EMBED Equation.DSMT4 .
По таблице значений функции Лапласа найдем такое значение аргумента EMBED Equation.DSMT4 , что EMBED Equation.DSMT4 : EMBED Equation.DSMT4 . Тогда
EMBED Equation.DSMT4 и EMBED Equation.DSMT4 .
Используя известную формулу для EMBED Equation.DSMT4 (см. Теорему 2 данного параграфа), имеем равенство:
EMBED Equation.DSMT4 ,
в котором единственной неизвестной является искомый объем выборки EMBED Equation.DSMT4 . Решая получившееся уравнение относительно EMBED Equation.DSMT4 , получаем
EMBED Equation.DSMT4 .
Подставляя в правую часть последнего равенства известные величины, получаем
EMBED Equation.DSMT4
(заметим, что округление в данном случае, по смыслу искомой величины, следует произвести до целых, причем в большую сторону, чтобы обеспечить, как говорят, запас по вероятности).
Повторяя проведенные рассуждения для случая бесповторной выборки, имеем:
EMBED Equation.DSMT4 ,
EMBED Equation.DSMT4 .
Решая полученное уравнение относительно EMBED Equation.DSMT4 , получаем
EMBED Equation.DSMT4 ,
откуда
EMBED Equation.DSMT4 ,
EMBED Equation.DSMT4
(также как и выше округление здесь произведено в большую сторону).
Таким образом, для того, чтобы с вероятностью 0,9973 неизвестное значение средней заработной платы всех рабочих накрывалось доверительным интервалом (144,73; 158,47) в случае повторной выборки, в эту выборку следует взять 113 рабочих. Аналогично, для того, чтобы с вероятностью 0,9973 неизвестное значение средней заработной платы всех рабочих накрывалось доверительным интервалом (145,33; 157,87) в случае бесповторной выборки, в выборку следует взять 94 рабочих.
Замечание. Если в задаче на выборочный метод объем генеральной совокупности много больше объема выборки (в ряде случаев это предполагается по умолчанию, а объем генеральной совокупности просто не указан), естественно считать, что EMBED Equation.DSMT4 . Как следует из формул Теоремы 1, случаи повторной и бесповторной выборок дают тогда совпадающие результаты.
7.5 Оценка генеральной доли
Пусть требуется оценить долю тех объектов заданной генеральной совокупности, которые удовлетворяют некоторому условию EMBED Equation.DSMT4 – генеральную долю EMBED Equation.DSMT4 . Для этого из генеральной совокупности выделяют выборку, и по результатам её обследования находят долю тех объектов, которые удовлетворяют условию EMBED Equation.DSMT4 – выборочную долю EMBED Equation.DSMT4 . Очевидно, что EMBED Equation.DSMT4 , где EMBED Equation.DSMT4 – объем выборки, EMBED Equation.DSMT4 – число тех её объектов, которые удовлетворяют условию EMBED Equation.DSMT4 . Выборочная доля в данном случае является той величиной, с помощью которой мы получим информацию о неизвестном значении генеральной доли.
Таким образом, выборочная доля EMBED Equation.DSMT4 является оценкой генеральной доли EMBED Equation.DSMT4 .
Пример. EMBED Equation.DSMT4 – доля бракованных деталей генеральной совокупности, EMBED Equation.DSMT4 – доля бракованных деталей в выборке. Условие (событие) EMBED Equation.DSMT4 – деталь, взятая наудачу из генеральной совокупности – бракована.
Простейший способ оценивания – точечное оценивание – подразумевает использование приближенного равенства EMBED Equation.DSMT4 .
Как и всякая оценка, выборочная доля EMBED Equation.DSMT4 является случайной величиной. Действительно, выборка из генеральной совокупности выделяется случайным образом. Соответственно то значение, которое примет выборочная доля, будет случайным.
Следующие теоремы характеризуют выборочную долю как случайную величину.
Теорема 1. Математическое ожидание выборочной доли равно генеральной доле:
EMBED Equation.DSMT4 .
Среднее квадратическое отклонение EMBED Equation.DSMT4 ( EMBED Equation.DSMT4 ) выборочной доли вычисляется по формулам
EMBED Equation.DSMT4
– в случае повторной выборки и
EMBED Equation.DSMT4
– в случае бесповторной выборки, где EMBED Equation.DSMT4 – объем генеральной совокупности.
Напомним, что по определению среднего квадратического отклонения в случае повторной выборки имеем EMBED Equation.DSMT4 (аналогично в случае бесповторной выборки).
Замечание. При применении формул Теоремы 1 полагают
EMBED Equation.DSMT4 .
Теорема 2. Закон распределения выборочной доли неограниченно приближается к нормальному закону при неограниченном увеличении объема выборки.
Подобно тому, как мы это сделали в предыдущем параграфе, как следствие Теоремы 2, получаем формулу доверительной вероятности:
EMBED Equation.DSMT4
– в случае повторной выборки. Заменяя в последнем равенстве EMBED Equation.DSMT4 на EMBED Equation.DSMT4 , получаем формулу доверительной вероятности в случае бесповторной выборки.
По определению, величина EMBED Equation.DSMT4 , фигурирующая в формуле доверительной вероятности, называется предельной ошибкой выборки. Интервал EMBED Equation.DSMT4 называется доверительным интервалом.
Выше было указано, в чем состоит точечная оценка генеральной доли. Интервальное оценивание сводится, например, к вычислению значения доверительной вероятности при заданной предельной ошибке выборки.
Теорема 3. В случае повторной выборки выборочная доля является несмещенной и состоятельной оценкой генеральной доли.
Пример. Выборочные данные о надое молока для 100 коров из 1000 представлены таблицей:
Найти вероятность того, что доля всех коров с надоем молока более 40 ц отличается от такой доли в выборке не более чем на 0,05 (по абсолютной величине), для случая повторной и бесповторной выборок.
Найти границы, в которых с вероятностью 0,9596 заключена доля всех коров с надоем более 40 ц.
Сколько коров надо обследовать, чтобы с вероятностью 0,9786 для генеральной доли коров с надоем более 40 ц можно было гарантировать те же границы что и в п.2.
Решение. Число EMBED Equation.DSMT4 коров с надоем более 40 ц равно 34 ( EMBED Equation.DSMT4 , см. заданный вариационный ряд). Тогда EMBED Equation.DSMT4 .
Для нахождения доверительной вероятности п. 1 задания воспользуемся одноименной формулой при EMBED Equation.DSMT4 .
Пусть рассматриваемая выборка – повторная. Тогда по формуле Теоремы 1, учитывая Замечание, получаем
EMBED Equation.DSMT4 .
Следовательно
EMBED Equation.DSMT4 .
Аналогично, в случае бесповторной выборки:
EMBED Equation.DSMT4 ,
EMBED Equation.DSMT4 .
Доверительным в данном случае является интервал EMBED Equation.DSMT4 . Таким образом, неизвестное значение доли всех коров с надоем более 40 ц накрывается доверительным интервалом (0,29;0,39) с вероятностью 0,7109 в случае повторной выборки и с вероятностью 0,733 в случае бесповторной выборки.
В п. 2 задания при заданном значении доверительной вероятности искомым является доверительный интервал. Поскольку значение выборочной доли известно, остается найти предельную ошибку выборки EMBED Equation.DSMT4 .
Пусть выборка – повторная. По условию, принимая во внимание формулу доверительной вероятности, имеем
EMBED Equation.DSMT4 .
По таблице значений функции Лапласа найдем такое EMBED Equation.DSMT4 , что EMBED Equation.DSMT4 : EMBED Equation.DSMT4 . Тогда EMBED Equation.DSMT4 и, используя найденное выше значение EMBED Equation.DSMT4 , получаем
EMBED Equation.DSMT4 .
Соответственно, доверительным будет интервал:
EMBED Equation.DSMT4 .
Пусть выборка – бесповторная. Аналогично предыдущему, получаем предельную ошибку выборки
EMBED Equation.DSMT4
и доверительный интервал:
EMBED Equation.DSMT4 .
Таким образом, доля всех коров с надоем молока более 40 ц с вероятностью 0,9596 накрывается доверительным интервалом (0,243; 0,437) в случае повторной выборки и интервалом (0,248; 0,432) в случае бесповторной выборки.
В п. 3 по заданным значениям доверительной вероятности и предельной ошибки выборки найдем необходимый объем выборки. Из начла решения заимствуем значение выборочной доли EMBED Equation.DSMT4 , найденное по исходному вариационному ряду.
Пусть выборка – повторная. По условию, принимая во внимание формулу доверительной вероятности, имеем:
EMBED Equation.DSMT4 .
По таблице значений функции Лапласа найдем такое EMBED Equation.DSMT4 , что EMBED Equation.DSMT4 : EMBED Equation.DSMT4 . Тогда EMBED Equation.DSMT4 и, EMBED Equation.DSMT4 . Подставляя вместо EMBED Equation.DSMT4 выражение из Теоремы 1, приходим к уравнению относительно неизвестной величины EMBED Equation.DSMT4 :
EMBED Equation.DSMT4 .
Решая это уравнение относительно EMBED Equation.DSMT4 , подставляя в полученную формулу известные величины, завершаем решение
EMBED Equation.DSMT4
(заметим, что, как и ранее, округление здесь произведено в большую сторону).
Аналогично, в случае бесповторной выборки из условия и формулы доверительной вероятности следует равенство
EMBED Equation.DSMT4
или, принимая во внимание известное выражение для EMBED Equation.DSMT4 (см. Теорему 1):
EMBED Equation.DSMT4 .
Решая это уравнение относительно EMBED Equation.DSMT4 , получаем
EMBED Equation.DSMT4 .
Подставляя в правую часть последнего равенства известные значения, окончательно имеем:
EMBED Equation.DSMT4 .
Таким образом, в повторную выборку надо взять 127 коров, чтобы с вероятностью 0,9786 можно было утверждать, что доля всех коров с надоем молока более 40 ц накрывается доверительным интервалом (0,243; 0,437). Аналогично, в бесповторную выборку надо взять 123 коровы, чтобы с вероятностью 0,9786 можно было утверждать, что доля всех коров с надоем молока более 40 ц накрывается доверительным интервалом (0,248; 0,432).
Домашнее задание: 9.19, 9.21, 9.23, 9.30.