Теория вероятности.
Случайные события и их классификация.
Определение: Опытом или испытанием называется реализация определенных условий, которые можно повторить.
Примеры:
бросание монеты;
игральный кубик;
выстрел из ружья или пистолета;
вытаскивание карты из колоды;
Определение: Случайным событием называется любой возможный исход опыта.
Обозначение: А, В, С…
Примеры:
бросание монеты:
А – герб;
В – решка;
игральный кубик:
А1 – значение 1;
А2 – значение 2; …
А6 – значение 6;
выстрел из ружья или пистолета:
А – попадание;
В – промах;
вытаскивание карты из колоды:
А – туз;
В – бубновая дама;
С – бубновая масть;
Определение: События называются несовместными, если они не могут произойти одновременно в одно испытание. В противном случае они называются совместными.
Примеры:
бросание монеты; несовместная
игральный кубик; несовместная
выстрел из ружья или пистолета; несовместная
вытаскивание карты из колоды; (А,В – несовместная; В,С – совместная;
А,С – совместная)
Определение: События называются единственно-возможными, если какое-либо из них произойдет в результате испытания.
Примеры:
бросание монеты; единственно-возможное;
игральный кубик; единственно-возможное
выстрел из ружья или пистолета; единственно-возможное
вытаскивание карты из колоды; не единственно-возможное
Определение: Если события несовместные и единственно-возможные, то они называются группой событий.
Примеры:
бросание монеты; полная группа
игральный кубик; полная группа
выстрел из ружья или пистолета; полная группа
вытаскивание карты из колоды; неполная группа
Определение: События считаются равновозможными, если нет никаких оснований предполагать, что какое-либо из них может происходить чаще, чем другое.
Примеры:
бросание монеты; равновозможное
игральный кубик; равновозможное
выстрел из ружья или пистолета; не равновозможное
вытаскивание карты из колоды; не равновозможное
Определение: Если события образуют полную группу и являются равновозможными, то они составляют классическую схему исходов.
Примеры:
бросание монеты; классическая схема
игральный кубик; классическая схема
выстрел из ружья или пистолета; нет классической схемы
вытаскивание карты из колоды; нет классической схемы
Определение: Если два события составляют полную группу, то они называются противоположными.
Обозначение: А и A

Примеры:
бросание монеты; противоположное событие
игральный кубик; не является противоположным
выстрел из ружья или пистолета; противоположное событие
вытаскивание карты из колоды; не является противоположным
Определение: Событие называется достоверным, если оно обязательно произойдет в результате испытания.
Вероятность события. Понятие о вероятности.
Определение: Вероятностью события считается объективная численная мера возможности наступления этого события.
Обозначение: Р(А); р;
Считают, что вероятность достоверного события равна 1, а вероятность невозможного события равна 0. Тогда вероятность любого события заключается в пределах от 0 до 1.
(1) EMBED Equation.DSMT4
Замечание: Иногда вероятность выражается в процентах. В таком случае полученный результат умножается на 100 (%).
Классическое определение вероятности: Пусть имеется классическая схема, состоящая из n исходов, и пусть m из них благоприятствует событию А. Тогда классическая вероятность события А определяется формулой:
(2) EMBED Equation.DSMT4
m – благоприятствующий;
n – всего количество исходов;
Формула 2 удовлетворяет всем требованиям, применяемым к вероятности.
Пример:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
1) игральный кубик
А – четная грань
n – 6; m – 6;
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
2) игральный кубик
А – единица
n – 6; m – 1;
EMBED Equation.DSMT4
3) колода карт
А1 – туз
EMBED Equation.DSMT4
n – 36; m – 4
А2 – бубновая дама
EMBED Equation.DSMT4
n – 36; m – 1
A3 – бубновая карта
n – 36; m – 9
Статистическая вероятность (частость, доля): Пусть производится n опытов, в которых событие А произошло m раз (имело m успехов). Тогда статистической вероятностью, или долей называется отношение
(3) EMBED Equation.DSMT4
Пример:
EMBED Equation.DSMT4
Бросание монеты.
статистическая вероятность:
n – 10; m – 8
EMBED Equation.DSMT4
классическая вероятность:
n – 2; m – 1
Замечание:
Статистическая вероятность может быть найдена только после проведения опытов, а для классической вероятности опыты не нужны.
Статистическая вероятность получается различной для разных серий опытов, однако при достаточно большом количестве опытов практически достоверно, что статистическая вероятность будет сколь угодно мало отличатся от классической вероятности (устойчивость статистической вероятности).

Операции над случайными событиями.
Суммой события А+В называется такое третье событие С, которое заключается в том, что хотя бы одно из событий-слагаемых произойдет, т.е. либо А, либо В, либо оба вместе.
EMBED Equation.DSMT4
Произведением двух событий А и В называется такое третье событие D, которое заключается в том, что оба события-сомножителя произошли, т.е.
EMBED Equation.DSMT4
Замечание: Если события не совместны, то их произведение является невозможным событием.
Теорема сложения вероятностей.
(5) EMBED Equation.DSMT4 для совместных событий.
(6) EMBED Equation.DSMT4 для несовместных событий.
Доказательство для несовместных событий.
Пусть имеется n возможных классических исходов.

Пусть m из них благоприятствуют событию А

и пусть k других (других, т.к. события несовместные и у них нет благоприятствующих исходов) исходов благоприятствуют событию В.

Тогда событию А+В благоприятствуют m+k исходов, т.е.
EMBED Equation.DSMT4 , что и требовалось доказать.
Следствие № 1: Теорема о сложении (формула 5) распространяется на любое конечное число несовместных событий (может быть 3, 4, 5…слагаемых).
Следствие № 2: Если события А1, А2, А3, …образуют полную группу, то сумма их вероятностей равна 1.
(6) EMBED Equation.DSMT4 полная группа
Доказательство:
Если события образуют полную группу, то их сумма является достоверным событием, вероятность которого равна 1, т.е.
EMBED Equation.DSMT4
Следствие № 3: Для противоположных событий справедливо равенство:
(7) EMBED Equation.DSMT4
Пример:
В пруду плавает 100 рыб. Из них 20 щук и 10 лещей. Случайным образом ловят одну рыбу.
А) Какова вероятность того что это щука или лещ.
Б) Какова вероятность что это рыба другого сорта
Решение:
А – щука; В – лещ.
А) EMBED Equation.DSMT4
Б) EMBED Equation.DSMT4
Зависимые и независимые события. Умножение вероятностей.
Пример:
В ящике имеется 10 электрических лампочек из которых 3 неисправны. На удачу одну за другой вынимают 2 лампочки. Какова вероятность того, что вторая лампочка исправна, если:
А) первая была исправна.
Б) первая была неисправна.
Т.к одну уже вытащили, то остается 9, т.е n – 9.
А) EMBED Equation.DSMT4
Б) EMBED Equation.DSMT4
Понятие об условной вероятности.
Под условной вероятностью мы понимаем вероятность одного события, вычисленное при условии, что другое событие произошло.
Определение: Условной вероятностью называется число, определяемое формулой:
(8) EMBED Equation.DSMT4 ,
где P (AB) – вероятность совместного исполнения события;
P (B) – вероятность того события, которое уже произошло;
Определение: События А и В называются независимыми, если
(9) EMBED Equation.DSMT4 в противном случае они называются зависимыми.
Замечание: Для независимых событий условная вероятность совпадает с обычной вероятностью.
Теорема умножения вероятностей.
(10) EMBED Equation.DSMT4
Вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого, т.е.
(11) EMBED Equation.DSMT4 для зависимых событий
Для независимых событий теорема умножения вероятностей представлена формулой 9.
Пример:
В ящике имеется 10 электрических лампочек из которых 3 неисправны. На удачу одну за другой вынимают 2 лампочки.
А) какова вероятность, что обе исправны.
Б) какова вероятность, что обе неисправны.
В) какова вероятность, что одна из двух исправна.
Г) какова вероятность, что хотя бы одна исправна.
Решение:
События зависимые (т.е. вероятность события В меняется от того, произошло событие А или нет)
А) EMBED Equation.DSMT4
Б) EMBED Equation.DSMT4
В) "первая хорошая, вторая плохая или первая плохая, вторая хорошая"
EMBED Equation.DSMT4
Г) "хотя бы одна исправна, т.е. одна или больше ( ? 1), первая исправна или вторая исправна
EMBED Equation.DSMT4
Замечание: Если вопрос задачи звучит как "хотя бы", то часто удобнее перейти к противоположному событию, т.е. "хотя бы одна исправная = 1 – Р (обе неисправны)"
EMBED Equation.DSMT4
Пример:
Бросаем 2 монеты. Событие А – 2 герба, событие В – 2 решки, событие С – 1 герб и 1 решка. Являются ли равновозможными события? Результаты для каждой из монет независимы.
Решение:
А) EMBED Equation.DSMT4
Б) EMBED Equation.DSMT4
В) "герб и решка или решка и герб"
EMBED Equation.DSMT4

Формула полной вероятности и формула Байеса.
Пример:
Однотипная продукция выпускается 3-мя цехами, производительности которых относятся как 1:3:2. Вероятность брака в каждом цехе составляет соответственно 1, 2 и 3%. Все изделия хранятся на одном складе. На удачу одно изделие выбирается на складе. Какова вероятность, что оно браковано.
Решение:
I – A1 EMBED Equation.DSMT4 EMBED Equation.DSMT4 составляют полную группу
II – A2 EMBED Equation.DSMT4 EMBED Equation.DSMT4
III – A3 EMBED Equation.DSMT4
E – бракованное изделие
EMBED Equation.DSMT4 EMBED Equation.DSMT4
Пусть событие Е может произойти с любым из событий A1, A2, и т.д., образующих полную группу. Тогда полная вероятность события Е определяется формулой:
(12) EMBED Equation.DSMT4
Пусть в условиях предыдущего примера известно, что наудачу взятое изделие оказалось бракованным.
А) какова вероятность, что оно было сделано в первом цеху.
Б) если известно, что изделие браковано, в каком цеху вероятнее всего было сделано.
Ответ на поставленный вопрос (переоценка гипотез при дополнении информации) дают формулы Байеса.
(13) EMBED Equation.DSMT4
Доказательство:
EMBED Equation.DSMT4
Выражая неизвестную величину через известные, получаем формулу 13, что и требовалось доказать.
С помощью формулы 13 отвечаем на вопрос задачи.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4

Решение задач с помощью числа сочетаний.
Определение сочетания: Пусть имеется N элементов. Составляем из них комбинации, содержащие M элементов. Если порядок элементов внутри комбинации не играет роли, то такие комбинации называются сочетаниями. Число таких сочетаний определяется формулой:
EMBED Equation.DSMT4 EMBED Equation.DSMT4
Пример:
N=10; M=3
EMBED Equation.DSMT4
Пример:
В студенческой группе 20 человек. Среди них 7 юношей и 13 девушек. Случайным образом отбирают 3-х человек для дежурства. Какова вероятность того, что:
А) все три юноши.
Б) две девушки и один юноша.
В) хотя бы 1 юноша.
EMBED Equation.DSMT4

А) EMBED Equation.DSMT4
Б) EMBED Equation.DSMT4
В) EMBED Equation.DSMT4

Г) "хотя бы один юноша"
EMBED Equation.DSMT4
Повторные независимые испытания.
Пусть событие А может произойти в любом из n испытаний с постоянной вероятностью р, не зависящей от исходов других испытаний. Такие испытания называются повторными независимыми, или схемой Бернулли. Если событие А произошло m раз, то говорят, что произошло m успехов в n испытаниях.
Если р – вероятность успеха, то q = 1 – р – вероятность неуспеха.
Формула Бернулли.
Вероятность того, что событие А произойдет m раз в n повторных испытаниях (m успехов в n испытаниях) определяется формулой:
(1) EMBED Equation.DSMT4
Пример:
Пусть стрелок делает 3 выстрела. Вероятность попадания при каждом выстреле равна р. Найти вероятность тому, что он попал 2 раза при трех выстрелах.
Решение:
n = 3; m = 2; p - постоянная; q = 1 – p;
EMBED Equation.DSMT4
Пример:
Вероятность того, что станок потребует рабочего в течение рабочего дня равна 0,2. всего рабочий обслуживает 4 станка. Найти вероятность того, что хотя бы один из них потребует внимания рабочего.
Решение:
n = 4; m ? 1; p – 0,2; q = 0,8;
EMBED Equation.DSMT4
Асимптотические формулы.
При большом количестве испытаний n формула Бернулли не удобна для вычислений, поэтому применяется приближенные формулы, результаты которых тем точнее, чем больше n.
Формула Пуассона (для редких событий).
Пусто событие А может произойти в любом из n повторных независимых испытаний с постоянной вероятностью р, отличной от 0 и 1. Пусть количество испытаний n достаточно велико, а вероятность р мала, т.е. выполняются условия Пуассона:
(1) EMBED Equation.DSMT4 тогда справедлива формула Пуассона:
(2) EMBED Equation.DSMT4
Замечания:
Функция, стоящая в правой части формулы 2 называется функцией Пуассона. Она затабулирована в учебнике на стр. 556. значение этой функции определяется по двум параметрам ? и m.
Формула 2 является приближенной, а формула 1 точной.
Пример:
Вероятность изготовления стандартной детали равна 0,995. Найти вероятность того, что среди 1000 деталей будет более 3-х браков.
Решение:
n = 1000 ? 100 ; m > 3; p = 0,005; q = 0,995;
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Локальная теорема Муавра-Лапласа.
Пусть событие А может произойти в любом из n повторных независимых испытаний с постоянной вероятностью р отличной от 0 и 1. пусть событие А не редкое, а количество испытаний достаточно велико, т.е. выполняются условия Муавра-Лапласа:
(1) EMBED Equation.DSMT4 тогда справедлива локальная формула Муавра-Лапласа:
(2) EMBED Equation.DSMT4 ; EMBED Equation.DSMT4 ; EMBED Equation.DSMT4 локальная функция Муавра-Лапласа
Замечание:
Значение локальной функции Муавра-Лапласа затабулировано в учебнике на стр. 553.
Свойства локальной функции Муавра-Лапласа.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Пример:
Вероятность того, что посеянное семя взойдет равна 0,85. найти вероятность того, что ровно 213 из 250 семян взойдет.
Решение:
n = 250 > 100; m = 213; p = 0,85; q = 0,15;
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4

Интегральная теорема Муавра-Лапласа.
Пусть событие А может произойти в любом из M повторных независимых испытаниях с постоянной вероятностью р отличной от 0 и 1. Пусть количество испытаний велико, а события не редкие, т.е выполняются условия Муавра-Лапласа. Тогда вероятность того, что количество успехов заключено в некотором интеграле определяется интегральной функцией Муавра-Лапласа.
(3) EMBED Equation.DSMT4
EMBED Equation.DSMT4 - интегральная функция Муавра-Лапласа
Замечание:
Значение интегральной функции Муавра-Лапласа затабулировано в учебнике на стр. 555.
Свойства интегральной функции Муавра-Лапласа:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Пример:
Вероятность того, что деталь не пройдет контроль равна 0,2. Найти вероятность того, что среди 400 деталей число не прошедших контроль заключено в пределах от 70 до 100.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4

EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Применим формулу 3 и подставим полученные данные.
EMBED Equation.DSMT4
EMBED Equation.DSMT4

Следствие из интегральной теоремы Муавра-Лапласа:
Для симметричного интервала для числа успехов:
Пример:
EMBED Equation.DSMT4
В условиях предыдущей задачи определить вероятность того, что число деталей не прошедших контроль заключено в пределах от 70 до 90.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Применяя формулу 4 получаем:
EMBED Equation.DSMT4

Для доли или частости успехов.
Если доля или частость успехов заключена в интервале, симметричном относительно р, то справедлива формула:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4


Задача № 1.
Вероятность того, что стрелок попадет в цель равна 0,7. Произведено 400 выстрелов. Найти вероятность того, что доля попаданий отклоняется от вероятности равной 0,7 не более чем на 0,04.
EMBED Equation.DSMT4

EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4

EMBED Equation.DSMT4

Ответ: С вероятностью 0,9281 можно утверждать, что доля попаданий отклоняется от вероятности равной 0,7 не более чем на 0,04.
Задача № 2.
В условиях предыдущей задачи определить, какой интервал для частости попаданий можно гарантировать с вероятностью 0,9281.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4


По таблице наоборот.
EMBED Equation.DSMT4

EMBED Equation.DSMT4
(6) EMBED Equation.DSMT4 ;
EMBED Equation.DSMT4
Ответ: Можно гарантировать интервал (0,66; 0,74) для доли попаданий с вероятностью 0,9281.
Задача № 3.
В условиях предыдущей задачи определить, сколько нужно произвести выстрелов, чтобы для доли попаданий гарантировать интервал (0,66; 0,74) с вероятностью 0,9281.
EMBED Equation.DSMT4


EMBED Equation.DSMT4
EMBED Equation.DSMT4
> (7)
EMBED Equation.DSMT4
Ответ: Необходимо произвести 400 выстрелов, чтобы для доли попаданий гарантировать интервал (0,66; 0,74) с вероятностью 0,9281.
Случайная величина.
Определение: Случайная величина это числовая функция, аргументом которой является множество случайных событий, т.е. каждому случайному событию ставится в соответствие некоторое число, которое является значением случайной величины.
X, Y – случайные величины.
x, y – их значения.
Определение: Вероятностью того или иного значения случайной величины называют вероятность соответствующего события.
Пример:
бросание игральной кости
Х – число выпавших очков – случайная величина
EMBED Equation.DSMT4
Определение: Случайная величина называется дискретной если ее значения являются дискретными. В противном случае, т.е. если значения случайной величины занимают некоторый промежуток, то случайная величина не является дискретной.
Пример:
Х – число очков на кубике – дискретная случайная величина.
Y – уровень воды в реке занимает некоторый промежуток от 6 до 10 метров, не является дискретной случайной величиной.
Закон распределения случайной величины.
Закон распределения случайной величины – закон, связывающий ее значение с соответствующей вероятностью.
Для дискретной случайной величины закон распределения может быть задан функцией распределения.
Ряд распределения дискретной случайной величины – таблица, в которой расположены ее значения в порядке возрастания с соответствующими вероятностями.
Замечание:
Так как все значения дискретной случайной величины составляют полную группу, то для любого ряда распределения сумма вероятностей равна 1.
Пример №1:
Стрелок два раза стреляет по мишени. Вероятность попадания равна 0,8. составить закон распределения дискретной случайной величины Х – числа попаданий при двух выстрелах.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Пример №2:
Стрелок имеет три патрона и стреляет до первого попадания или до израсходования все патронов. Вероятность попадания при каждом выстреле равна 0,6. составить закон распределения случайной величины Х – числа произведенных выстрелов.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Операции над случайными величинами.
Пусть даны две случайные независимые величины Х и Y. Две случайные величины являются независимыми, если независимыми являются события, составляющие любой порядок их событий.
умножение на число – значения случайных величин умножаются на это число, а их вероятности не изменяются;
возведение в натуральную степень (квадрат, куб и т.д) – значения возводятся в степень, а вероятности не изменяются;
сложение, вычитание, умножение независимых случайных величин – значения попарно складываются, а соответствующие вероятности перемножаются;
Пример:
Даны две независимые случайные величины Х и Y. Составить закон распределения случайной величины Z = 2X + Y.



EMBED Equation.DSMT4

Числовые характеристики случайной величины.
Математическое ожидание.
Обозначение: EMBED Equation.DSMT4
Пояснение: математическое ожидание характеризует значение случайной величины.
Определение: Математическим ожиданием называется сумма произведений значений случайной величины на соответствующие вероятности, т.е.:
(1) EMBED Equation.DSMT4
Пример № 1: (см. выше)
Вычислите математическое ожидание.
EMBED Equation.DSMT4 EMBED Equation.DSMT4
Свойства математического ожидания.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
если X и Y – независимые случайные величины >
Дисперсия.
Пояснение: дисперсия характеризует средний разброс значений случайной величины относительно ее математического ожидания.
Определение: Дисперсией называется математическое ожидание квадрата отклонения значений случайной величины от ее математического ожидания, т.е.:
EMBED Equation.DSMT4
(2)
Пример:
EMBED Equation.DSMT4
Свойства дисперсии.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
если X и Y – независимые случайные величины >
формула для вычисления дисперсии:
(3) EMBED Equation.DSMT4
Доказательство:
EMBED Equation.DSMT4
Пример № 1:
Вычислить дисперсию по формуле 3.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Среднее квадратическое отклонение.
Пояснение: характеризует средний разброс в тех же единицах, что и сама случайная величина.
Обозначение: EMBED Equation.DSMT4
(4) EMBED Equation.DSMT4
Пример № 1:
EMBED Equation.DSMT4

Числовые характеристики суммы и среднего арифметического случайных величин.
Пусть заданы n независимых случайных величин X1, Х2, …, Хn имеющих математические ожидания a1, a2, …, an и дисперсии ?2, ?2,…, ?2. рассмотрим
EMBED Equation.DSMT4
случайную величину Y, равную их сумме (Y = X1 + Х2 + …+ Хn) и случайную величину Z, равную их среднему арифметическому
тогда математическое ожидание их суммы равно суме их математических ожиданий
(1) EMBED Equation.DSMT4
дисперсия суммы равна
(2) EMBED Equation.DSMT4
математическое ожидание среднего арифметического равно
(3) EMBED Equation.DSMT4
дисперсия среднего арифметического равна
(4) EMBED Equation.DSMT4
Частные случаи: если a1 = a2 = …= an , т.е все математические ожидания одинаковы, то
(1а) EMBED Equation.DSMT4
(3а) EMBED Equation.DSMT4
Замечания:
Формулы 1-4 следуют из свойств математического ожидания и дисперсии.
из формулы 4 следует, что дисперсия среднего арифметического случайных величин в n раз меньше, чем дисперсия каждого из слагаемых, поэтому для уменьшения ошибки рекомендуется использовать среднее арифметическое.
Важные примеры дискретных случайных величин.
Биноминальная случайная величина (закон Бернулли).
Случайная величина Х называется биноминальной или распределенной по закону Бернулли, если ее закон распределения имеет следующий вид:
, где
EMBED Equation.DSMT4
т.е Х – число успехов m в n повторных независимых
испытаниях, а вероятности вычисляются по формуле Бернулли.
Пример № 1 – пример биноминальной случайной величины.

Числовые характеристики биноминальной случайной величины.
Можно доказать, что:
(5) EMBED Equation.DSMT4
(6) EMBED Equation.DSMT4
(7) EMBED Equation.DSMT4
Пример № 1 по формулам 5, 6, 7 вычислить числовые характеристики случайной величины.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Распределение Пуассона.
Случайная величина Х называется распределенной по закону Пуассона, если ее закон распределения имеет вид:

(8) EMBED Equation.DSMT4
(9) EMBED Equation.DSMT4
Пример:
Известно, что для случайной величины Х вероятность того, что Х принимает значение К равна:
EMBED Equation.DSMT4
Определить по какому закону распределена эта случайная величина, найти ее математическое
ожидание, дисперсию и вероятность того, что она принимает значение равное 3.
распределение Пуассона;
Математическое ожидание = 2; Дисперсия = 2;
EMBED Equation.DSMT4
Частость или доля успехов в n повторных независимых испытаниях.
EMBED Equation.DSMT4
Используя формулы 5 и 6 и свойства математического ожидания и дисперсии, получаем:
(10) EMBED Equation.DSMT4
(11) EMBED Equation.DSMT4
Функция распределения случайной величины.
Закон распределения случайной величины может быть задан в виде функции распределения, которая тоже связывает значение случайной величины и соответствующую вероятность.
Определение: Функцией распределения называется числовая функция числового аргумента F(x) равная вероятности того, что случайная величина примет значение меньше этого аргумента, т.е.:
(12) EMBED Equation.DSMT4
Общие свойства функции распределения.
F(x) – возрастающая;
EMBED Equation.DSMT4 - т.к это вероятность;
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Пример:
Найти функцию распределения и построить график для примера 1.

EMBED Equation.DSMT4

EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Особенности функции распределения для дискретной случайной величины.
График имеет ступенчатый вид.
Самая нижняя ступень равна, самая верхняя равна.
Скачки ступеней происходят в точках, соответствующих значениям случайной величины.
Скачок ступени происходит на величину p1, p2, …
Пример:

Непрерывная случайная величина.
Определение: Пусть задана случайная величина Х. Пусть ее функция распределения F(x) дифференцируема. Плотностью вероятности ?(х) называется производная от функции распределения.
(1) EMBED Equation.DSMT4
Определение: Если плотность вероятности существует и непрерывна почти повсюду, то величина Х называется непрерывной.
Свойства плотности вероятности.
EMBED Equation.DSMT4 - производная возрастающей функции;
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Площадь фигуры над графиком плотности вероятности равна 1.
Доказательство:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Геометрически это площадь левее ?
EMBED Equation.DSMT4
Геометрически это площадь правее ?

EMBED Equation.DSMT4
Геометрически это площадь между ? и ?
Следствие из свойства 7:
Для любой непрерывной случайной величины
вероятность принять любое конкретное значение равна 0, т.е. если Х – непрерывно, то:
EMBED Equation.DSMT4
Доказательство:
EMBED Equation.DSMT4

Вывод: Для непрерывной случайной величины безразлично включать ли концы интервалов в неравенство или нет.
Пример 1н.:
Плотность распределения задана формулой:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Числовые характеристики непрерывной случайной величины.
Математическое ожидание.
(2) EMBED Equation.DSMT4 , если такой интеграл
Дисперсия.
(3) EMBED Equation.DSMT4 , если такой интеграл сходится.
Среднее квадратическое отклонение.
(4) EMBED Equation.DSMT4
Замечание: свойства числовых характеристик сохраняются.
Пример 1н.:
Вычислить математическое ожидание и дисперсию.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Пример:
Функция распределения имеет вид:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
1)
EMBED Equation.DSMT4
EMBED Equation.DSMT4
2) EMBED Equation.DSMT4
3) EMBED Equation.DSMT4
EMBED Equation.DSMT4
Важный пример непрерывной случайной величины.
Нормально-распределенная случайная величина (закон Гаусса).
Определение: Случайная величина называется нормально-распределенной, если ее плотность вероятности имеет вид:
(5) EMBED Equation.DSMT4
Замечание: нормальный закон распределения зависит от двух параметров: a, ? (?2) (N(a;?)).
Можно доказать, что математическое ожидание ХN равно a.
(6) EMBED Equation.DSMT4
Пример:
Написать плотность вероятности
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Функция распределения непрерывной случайной величины является первообразной от плотности и имеет вид:
(7) EMBED Equation.DSMT4 , где ?(t) – интегральная функция Муавра-Лапласа.
Замечание: т.к. ?(t) – затабулирована, то для нормального закона распределения, можно вычислить любые вероятности. Графиком плотности вероятности нормального закона распределения является кривая Гаусса.
Замечания:
график симметричен относительно прямой х = а (математическое ожидание);
чем больше дисперсия ?2, тем ниже max и тем шире пик кривой, т.е. ее разброс, относительно среднего значения.

Вычисление вероятности для нормального закона распределения.
1. (рис. 1)
(8) EMBED Equation.DSMT4

2. (рис. 2)
(9) EMBED Equation.DSMT4

3. (рис. 3)
(10) EMBED Equation.DSMT4

4. (рис. 4) симметричный интервал
(*) EMBED Equation.DSMT4
Правило трех сигм.
Возьмем интервал, где ? = 3? и подставим формулу * >
EMBED Equation.DSMT4
Практический вывод: Значение нормальной случайной величины, которое отличается от математического ожидания более чем на 3?, практически не встречаются.
Задача:
Пусть случайная величина Х распределена по нормальному закону.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Понятие о теореме Ляпунова.
Пусть имеется n независимых случайных величин, каждая из которых имеют математическое ожидание и дисперсию. Пусть, кроме того, выполняется условие Ляпунова, которое заключается в том, что каждая из этих случайных величин вносит примерно одинаковый вклад в их сумму, тогда сумма и среднее арифметическое этих случайных величин имеют нормальный или почти нормальный закон распределения.
Закон больших чисел.
Принцип практической уверенности.
Пусть событие А может произойти в одном испытании, вероятность которого P? достаточно мала.
Будем считать, что такое событие практически не возможно при однократном опыте. А противоположное событие A, вероятность которого равна 1-? близка к 1 будем считать практически достоверным.
Вероятность ?, которой решено пренебречь называется уровнем значимости.
Уровень значимости устанавливается конкретно для каждого типа задач. Для экономических задач обычно полагают ? = 0,5. если задача связана с риском для жизни или с высокой ответственностью, то ? резко уменьшают.
Вывод: Практически достоверным мы называем событие, вероятность которого близка к единице.
Смысл закона больших чисел.
Закон больших чисел, это ряд утверждений, в которых говорится, что при достаточно большом числе испытаний n практически достоверными являются следующие события:
Среднеарифметическое случайных величин сколь угодно мало отличается от среднеарифметического их математических ожиданий (устойчивость среднеарифметического);
Частость наступления событий сколь угодно мало отличается от вероятности наступления этого события (устойчивость частости);
Количественное выражение закона больших чисел.
Лемма Чебышева или неравенство Маркова.
Пусть случайная величина Х принимает только неотрицательные значения и имеет математическое ожидание. Тогда для любого положительного числа А справедливо неравенство:
(1) EMBED Equation.DSMT4
(2) EMBED Equation.DSMT4 , где EMBED Equation.DSMT4 и имеет математическое ожидание
Пример:
Пусть случайная величина Х – уровень воды в реке. Среднегодовой уровень равен 8 метров. Оценить вероятность того, что уровень воды не превзойдет 10 метров.
EMBED Equation.DSMT4
Ответ: С вероятность не меньше, чем 0,2 можно утверждать, что уровень воды не превзойдет 10 метров.
Неравенство Чебышева для симметричного интервала.
Пусть случайная величина Х имеет математическое ожидание и дисперсию (М(х) и D(х)). Рассмотрим интервал, симметричный относительно математического ожидания.
Тогда справедливо следующее неравенство:
(3) EMBED Equation.DSMT4
(4) EMBED Equation.DSMT4 , (самое распространенное)
Доказательство неравенства 4.
EMBED Equation.DSMT4 применим к неотрицательной случайной величине y неравенство Маркова (формула 2) >
EMBED Equation.DSMT4
Пример:
Пусть случайная величина Х – число попаданий при 100 выстрелах. Вероятность попадания при каждом выстреле равна 0,8. Можно ли применить неравенство Чебышева для оценки вероятности того, что число попаданий заключено в границах от 72 до 90? Как рекомендуется изменить правую границу? После применения неравенства Чебышева уточнить результат с помощью следствия из интегральной теоремы Муавра-Лапласа.
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Используя формулу 4 >
EMBED Equation.DSMT4
Ответ: С вероятностью не менее, чем 0,75 можно утверждать, что число попаданий заключено в интервале от 72 до 88.
Уточним результат с помощью 1-го следствия из интегральной теоремы Муавра-Лапласа для числа успехов в симметричном интервале:
EMBED Equation.DSMT4
Вывод: полученный результат не противоречит, а уточняет предыдущую оценку.
Неравенство Чебышева для среднего арифметического случайных величин.
Пусть даны независимые случайные величины X1, Х2, …, Хn имеющих математические ожидания a1, a2, …, an и дисперсии, каждая из которых ограничена числом С EMBED Equation.DSMT4 , тогда справедливо неравенство:
(5) EMBED Equation.DSMT4
Пояснение к доказательству: неравенство 4 применяется к среднему арифметическому случайных величин. Тогда EMBED Equation.DSMT4
Пример:
Имеется 100 участков, засеянных пшеницей. Рассмотрим случайные величины X1, Х2, …, Х100 – урожайность с каждого участка. Средняя урожайность на каждом участке составляет 40 центнеров с гектара. А средние квадратические отклонения этих случайных величин не превосходят 2-х центнеров. Оценить вероятность того, что средняя урожайность со всех участков отличается от средней на каждом участке не более чем на 3 единицы.
Дано:
EMBED Equation.DSMT4
X1, Х2, …, Х100 – случайные величины.
a1 = a2 = …, an = 40
EMBED Equation.DSMT4
Ответ: С вероятностью не менее чем 0,99, можно утверждать, что средняя урожайность со всех участков отличается от средней на каждом участке не более чем на 3 единицы.
Теорема Чебышева об устойчивости среднего арифметического.
EMBED Equation.DSMT4
перейдем к переделу в обеих частях неравенства при EMBED Equation.DSMT4
Правая часть формулы 4 стремится к 1, а левая не может быть больше 1, т.к. является вероятностью. Тогда в переделе получаем равенство:
(6) EMBED Equation.DSMT4
EMBED Equation.DSMT4 , т.е. говорят, что среднее арифметическое случайной величины сходится по вероятности среднего арифметического их математических ожиданий.
Теорема Чебышева.
При достаточно большом n практически достоверно, что среднее арифметическое случайной величины сколь угодно мало отличается от среднего арифметического их математических ожиданий (устойчивость среднего арифметического).
Неравенство Чебышева для доли или частости (неравенство Бернулли).
EMBED Equation.DSMT4
Применим неравенство 4 для случайной величины EMBED Equation.DSMT4 >
EMBED Equation.DSMT4
(7)

Замечание:
По неравенству 7 можно оценить либо вероятность P, либо отклонение ?, либо число испытаний n (см. аналогичные задачи 2-е следствие из интегральной теоремы Муавра-Лапласа).
Пример:
Вероятность попадания в цель при одном выстреле равна 0,3. произведено 100 выстрелов. Оценить вероятность того, что процент попадания будет заключен в пределах от 25% до 35%. Уточнить результат с помощью следствия из интегральной теоремы Муавра-Лапласа.
Дано:
EMBED Equation.DSMT4
Используя формулу 7 >
EMBED Equation.DSMT4
Ответ:
С вероятностью не менее, чем 0,16 можно утверждать, что процент попадания будет заключен в пределах от 25% до 35%.
EMBED Equation.DSMT4
Вывод: полученный результат не противоречит, а уточняет предыдущую оценку.
Пример:
В условиях предыдущей задачи оценить количество выстрелов, чтобы с вероятностью не меньше чем 0,8 можно было гарантировать отклонение ? = 0,05.
Дано:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4 EMBED Equation.DSMT4
Ответ: Нужно произвести не менее 420 выстрелов, чтобы с вероятностью не менее 0,8 гарантировать отклонение ? = 0,05.
Теорема Бернулли.
В неравенстве EMBED Equation.DSMT4 перейдем к переделу при EMBED Equation.DSMT4 получаем:
(8) EMBED Equation.DSMT4
EMBED Equation.DSMT4 , т.е. говорят, что частость сходится по вероятности к вероятности p этого события.
Теорема Бернулли.
При достаточно большом числе испытаний n практически достоверно, что частость сколь угодно мало отличается от вероятности наступления события (устойчивость частости).
Математическая статистика.
Вариационный ряд.
Пусть изучается признак Х, который может принимать значение х. Например:
Х1 – размер обуви;
х1 – 35; 36;
Х2 – рост;
х2 Є (140;210)
Пусть исследуется n объектов, которые являются носителями признака Х. Результаты изучения признака можно занести в таблицу, которая называется вариационным рядом. Вариационный ряд – таблица, в которой значения признака расположены в порядке возрастания, и которая содержит соответствующие частоты. Если значение признака хi встречаются n и t раз, то число ni называется частотой данной варианты.
таблица 1.
EMBED Equation.DSMT4 Можно также рассматривать частости для каждой варианты.
EMBED Equation.DSMT4 EMBED Equation.DSMT4
Замечание: частости являются аналогом вероятности.
Если значения признака не дискретны, т.е. заполняют некоторый интервал, то этот интервал разбивают на несколько возрастающих интервалов и получают так называемый интервальный вариационный ряд.
таблица 2.
EMBED Equation.DSMT4
Любой интервальный ряд можно превратить в дискретный, используя вместо хi середины интервалов.
Числовые характеристики дискретного числового ряда.
Среднее значение (аналог математического ожидания).
(1) EMBED Equation.DSMT4

Дисперсия вариационного ряда (аналог дисперсии случайной величины).
(2) EMBED Equation.DSMT4
Среднее квадратическое отклонение вариационного ряда (аналог среднего квадратического отклонения случайной величины).
(3) EMBED Equation.DSMT4
Свойства числовых характеристик вариационного ряда аналогичны свойствам характеристик случайных величин.
Пример:
Х – рост.
EMBED Equation.DSMT4
EMBED Equation.DSMT4

Выборочный метод.
Определение: Пусть требуется изучить признак Х. Все элементы подлежащие изучению называются генеральной совокупностью.
Обозначение: N – количество элементов генеральной совокупности (объем генеральной совокупности).
На всей генеральной совокупности признак Х имеет следующий вариационный ряд.
таблица 1.
Вариационный ряд для всей генеральной совокупности называется генеральным вариационным рядом.
Характеристики генерального вариационного ряда называются генеральными характеристиками.
Генеральное среднее:
(1) EMBED Equation.DSMT4
Генеральная дисперсия:
(2) EMBED Equation.DSMT4
Генеральное среднее квадратическое отклонение:
(3) EMBED Equation.DSMT4
Генеральная доля или вероятность признака:
(4) EMBED Equation.DSMT4
Как правило, распределение признака Х во всей генеральной совокупности неизвестно, т.е. неизвестен генеральный вариационный ряд, неизвестны все генеральные характеристики (формула 1-4).
Неизвестные параметры генеральной совокупности можно оценить с помощью результатов случайной выборки. Обследование всей генеральной совокупности бывает либо слишком дорого, либо практически невозможно (разрушаются элементы генеральной совокупности).
Определение: Часть элементов генеральной совокупности отобранных случайно называются случайной выборкой.
Количество элементов в выборке называется объемом выборки.
Выборка должна обладать свойством репрезентативности, т.е. она должна представлять всю генеральную совокупность. Для этого выборка должна отвечать следующим требованиям:
Выборка должна быть достаточно большой, чтобы проявились массовые закономерности.
Выборка должна быть случайной, чтобы каждый элемент генеральной совокупности мог иметь одинаковый с другими шанс попасть в выборку.
Существуют различные способы образования выборки (см. учебник).
Математическая статистика рассматривает собственно случайную выборку с повторным и бесповторным отбором членов. При повторном отборе элемент после обследования возвращается в генеральную совокупность, при бесповторном не возвращается. Бесповторная выборка более информативна, т.к. один и тот же элемент не может попасть в выборку дважды.
Пусть образована выборка объема n. В результате изучения признака Х на этой выборке получаем вариационный ряд, который называется выборочным вариационным рядом.
таблица 2.
EMBED Equation.DSMT4
Все характеристики выборочного вариационного ряда называются выборочными характеристиками:
Выборочное среднее:
(5) EMBED Equation.DSMT4
Выборочная дисперсия:
(6) EMBED Equation.DSMT4
Выборочная средняя квадратическая ошибка:
(7) EMBED Equation.DSMT4
Выборочная доля или частость:
(8) EMBED Equation.DSMT4
Все характеристики выборочного вариационного ряда являются случайными величинами, т.к. отобраны случайным образом.
Точечные оценки.
Характеристики генеральной совокупности называются неизвестными параметрами.
Обозначение: ? (тэта).
Определение: Оценкой неизвестного параметра ? называется случайная величина Х, с помощью которой делаются выводы о неизвестном значении данного параметра.
Для практических целей вместо неизвестного параметра берут приближенно значение его оценки ? ? Х.
Для оценки неизвестных параметров 1, 2, 3, 4 генеральной совокупности, как правило, берут оценки 5, 6, 7, 8 соответственно, т.е.:
Теоремы об оценках.
Теорема 1: Для повторной и бесповторной выборок при достаточно большом объеме выборки n выборочное среднее является случайной величиной распределенной по нормальному закону со следующими характеристиками (для средних):
(9) EMBED Equation.DSMT4
EMBED Equation.DSMT4
(10) - повторная выборка
- бесповторная выборка
Теорема 2: Для повторной и бесповторной выборок при достаточно большом объеме выборки n выборочная доля является случайной величиной, распределенной по нормальному или почти нормальному закону со следующими характеристиками:
(11) EMBED Equation.DSMT4
- повторная выборка EMBED Equation.DSMT4
(12)
- бесповторная выборка

Требования к оценкам.
Пусть случайная величина Х является оценкой неизвестного параметра ?:
Оценка называется несмещенной, если математическое ожидание оценки совпадает с оцениваемыми параметрами, т.е.:
(13) EMBED Equation.DSMT4
Оценка называется состоятельной, если при достаточно большом объеме выборки n практически достоверно, что оценка сколь угодно мало отличается от оцениваемого параметра.
EMBED Equation.DSMT4
Состоятельная оценка называется эффективной, если она имеет наименьшую дисперсию на всех выборках данного объема n.
Теорема 3 (для средней): Выборочная средняя EMBED Equation.DSMT4 является несмещенной состоятельной оценкой для генеральной средней: EMBED Equation.DSMT4
Теорема 4 (для доли): Выборочная доля является несмещенной состоятельной оценкой для генеральной доли: EMBED Equation.DSMT4
Теорема 5 (для дисперсии): Выборочная дисперсия является смещенной состоятельной оценкой для генеральной дисперсии: EMBED Equation.DSMT4
Несмещенной состоятельной оценкой для генеральной дисперсии является та называемая "исправленная" выборочная дисперсия:
(14) EMBED Equation.DSMT4
Замечание: при достаточно большом объеме выборки n множитель EMBED Equation.DSMT4 , поэтому EMBED Equation.DSMT4 , поэтому для практических целей можно применять любую из этих двух величин.
Средние квадратические ошибки.
Определение: Среднеквадратической ошибкой для выборочной средней называется среднеквадратическое отклонение выборочной средней.
Обозначение:
(15) EMBED Equation.DSMT4
Определение: Среднеквадратической ошибкой для выборочной доли называется среднеквадратическое отклонение выборочной доли.
(16) EMBED Equation.DSMT4
В теоремах 1 (для средней) и 2 (для доли) имеются формулы для соответствующих дисперсий (10, 12). Однако каждая из этих формул содержит неизвестные генеральные параметры:
в формуле 10 неизвестна генеральная дисперсия EMBED Equation.DSMT4 ;
в формуле 12 неизвестна генеральная доля р;
поэтому формулы 10 и 12 практически не применяются.
Для того чтобы можно было применять эти формулы на практике, заменяем неизвестные параметры их выборочными оценками:
EMBED Equation.DSMT4 ; EMBED Equation.DSMT4
Тогда получим расчетные формулы для средних квадратических ошибок.
Табл. 3 Среднеквадратические ошибки.
Замечания:
т.к. EMBED Equation.DSMT4 , то средние квадратические ошибки для бесповторной выборки меньше, чем для повторной (если ошибки меньше, то они лучше, т.е. бесповторная выборка лучше, чем повторная);
если объем генеральной совокупности N очень велик, то EMBED Equation.DSMT4 . В этом случае результаты повторной и бесповторной выборок практически совпадают;



Доверительная вероятность.
Интервальное оценивание.
Заменяя неизвестный параметр ? его оценкой Х, мы допускаем некоторую ошибку ?, т.е. EMBED Equation.DSMT4 .
? - называется предельной ошибкой выборки, т.е. предельная ошибка выборки – max отклонение по модулю оценки от оцениваемого параметра, которое мы можем гарантировать с определенной надежностью.
Определение: Надежностью или доверительной вероятностью называется вероятность того, что оценка отличается от оцениваемого параметра не более, чем на ?.
(17) EMBED Equation.DSMT4 - доверительная вероятность (надежность).
Р – доверительная вероятность (надежность);
х – оценка, случайная величина;
? – неизвестный параметр, число;
? – предельная ошибка выборки;
Доверительная вероятность при оценивании среднего значения.
Пусть требуется оценить неизвестное генеральное среднее, т.е. параметр EMBED Equation.DSMT4 . В соответствие с теоремой 3 его оценкой EMBED Equation.DSMT4 является выборочная средняя. По теореме 3 она имеет нормальный закон распределения, параметры которого известны из теоремы 1 (формулы 9 и 10).
Рассмотрим формулу *:
EMBED Equation.DSMT4
Применим формулу * к выборочной средней. Получаем:
(18) EMBED Equation.DSMT4 - доверительная вероятность для оценки выборочной средней, где:
Р – доверительная вероятность (надежность);
EMBED Equation.DSMT4 - выборочное среднее, случайная величина, оценка, имеет нормальный закон распределения;
EMBED Equation.DSMT4 - генеральное среднее, неизвестный параметр;
? - предельная ошибка выборки;
EMBED Equation.DSMT4 - средняя квадратическая ошибка для выборочной средней (среднее квадратическое отклонение для выборочной средней) (см. табл. 3).
Доверительная вероятность при оценивании генеральной доли (вероятности).
Пусть требуется оценить неизвестный генеральный параметр. Р – генеральная доля (вероятность), т.е. в формуле 17 неизвестным параметром является ?. В качестве оценки Х берем выборочную долю w (в соответствие с теоремой 4). Т.к. по теореме 2 выборочная доля w имеет нормальный закон распределения с параметрами 11, 12, то применим формулу * к случайной величине w:
(19) EMBED Equation.DSMT4 - доверительная вероятность для оценки доли, где:
Р – доверительная вероятность;
w – выборочная доля, случайная величина, имеет нормальный закон распределения, оценка;
р – генеральная доля или вероятность признака, неизвестный параметр;
? - предельная ошибка;
EMBED Equation.DSMT4 - средняя квадратическая ошибка для доли (см. табл. 3, 2-я строчка), среднее квадратическое отклонение для выборочной доли.
Для решения задач:
для доли или для средней;
определение доверительной вероятности;
определение (оценка) предельной ошибки ? и доверительного интервала (х-?; х+?);
определение необходимого объема выборки n – повторная, n' – бесповторная;
Пример:
С целью изучения средней производительности ткачей по схеме случайной бесповторной выборки было отобрано 100 ткачей из 2000. результаты занесены в таблицу.
1) Определить вероятность того, что средняя производительность ткача на всем комбинате отличается от средней производительности в выборке не более чем на 2 метра (по модулю).
Дано:
бесповторная выборка
EMBED Equation.DSMT4
Формула доверительной вероятности для средней:
EMBED Equation.DSMT4
EMBED Equation.DSMT4 - средняя производительность ткача
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
2) В условиях предыдущей задачи определить какова максимальная ошибка ? и каков доверительный интервал для средней производительности ткача, который можно гарантировать с вероятностью Р = 0,95.
Дано:
EMBED Equation.DSMT4
Используя формулу 18 и данные, полученные в предыдущей задаче:
EMBED Equation.DSMT4
EMBED Equation.DSMT4 используя таблицу наоборот, получаем EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
(80,9; 93,71)
Замечание: Доверительный интервал имеет границы, которые являются случайными величинами.
Ответ: с доверительной вероятностью 0,95 можно утверждать, что интервал (80,9; 93,71) генеральную среднюю – среднюю производительность ткачей на всем комбинате.
3) Какой должен быть объем повторной и бесповторной выборок, чтобы в условиях данной задачи с доверительной вероятностью Р равной 0,95 можно было гарантировать ошибку ? = 1,81 для средней производительности ткачей.
Дано:
EMBED Equation.DSMT4
Используя формулу 18 и данные, полученные в предыдущей задаче:
EMBED Equation.DSMT4
EMBED Equation.DSMT4 используя таблицу наоборот, получаем EMBED Equation.DSMT4
а) пусть выборка повторная:
EMBED Equation.DSMT4
Объем повторной выборки при оценке среднего значения:
(20) EMBED Equation.DSMT4
EMBED Equation.DSMT4
б) бесповторная выборка:
Объем бесповторной выборки при оценке среднего значения:
(21) EMBED Equation.DSMT4
EMBED Equation.DSMT4
Ответ: нужно обследовать 105 ткачей для повторной выборки (100 для бесповторной) чтобы с вероятностью Р = 0,95 гарантировать наибольшее отклонение ? = 1,81 для средней производительности ткачей.
4) В условиях исходной задачи определить вероятность того, что доля ткачей, у которых производительность не более 75 метров на всем комбинате отличается от доли таких ткачей в выборке по модулю не более чем на 0,05.
Дано:
EMBED Equation.DSMT4
EMBED Equation.DSMT4 - выборочная доля
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Ответ: с вероятность 0,778 можно утверждать, что доля ткачей, у которых производительность не более 75 метров на всем комбинате отличается от доли таких ткачей в выборке по модулю не более чем на 0,05.
5) В условиях задачи найти ? и доверительный интервал для доли ткачей на всем комбинате, чья производительность не более 75 метров, который можно гарантировать с вероятностью Р=0,778
Дано:
EMBED Equation.DSMT4
Используя формулу 19 и данные, полученные в предыдущей задаче:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
(0,18; 0,28)
Замечание: Доверительный интервал имеет границы, которые являются случайными величинами.
Ответ: с вероятностью 0,778 можно утверждать , что доверительный интервал (0,18; 0,28) содержит генеральную долю ткачей, чья производительность не более 75 метров.
6) В условиях первоначальной задачи определить, сколько надо обследовать ткачей в случае повторной и бесповторной выборки, чтобы с вероятностью Р = 0,778 можно было гарантировать наибольшее отклонение ? равное 0,05 для доли ткачей, чья производительность не более 75 метров. Ответ дать для случая:
а) когда есть предварительная выборка;
б) когда никаких предварительных данных нет;
Дано:
EMBED Equation.DSMT4
а) предварительная выборка:
1) повторная выборка:
EMBED Equation.DSMT4
Объем повторной выборки при оценке доли:
(22) EMBED Equation.DSMT4
EMBED Equation.DSMT4
2) бесповторная выборка:
EMBED Equation.DSMT4
Ответ: нужно обследовать 105 ткачей для повторной выборки (100 для бесповторной) чтобы с вероятностью Р = 0,778 гарантировать ? = 0,05 для доли ткачей, чья производительность не более 75 метров.
б) никаких предварительных данных нет (т.е. нет исходной таблицы)
Тогда рассмотрим формулу 22 как функцию переменной W:
EMBED Equation.DSMT4 и ищем при каких W достигается max этой функции. Можно доказать, что max достигается при w = 0,5. Тогда >
Объем выборки при оценке доли, если никаких предварительных данных нет:
(23) EMBED Equation.DSMT4
EMBED Equation.DSMT4
Проверка гипотез.
Критерии согласия.
В некоторых случаях нас интересует неизвестный закон распределения изученного признака Х во всей генеральной совокупности. В этом случае информация о законе распределения поступает с помощью выборки.
Формируется гипотеза Н0 о неизвестном законе распределения и по выборочным данным эта гипотеза либо отвергается либо принимается.
Правило, по которому решается отвергнуть гипотезу Н0 или нет называется критерием согласия.
Гипотеза Н0 может быть выдвинута не только о неизвестном законе распределения. Поскольку о признаке Х в генеральной совокупности, как правило, ничего не известно, то любое предположение относительно этого признака нуждается в подтверждении с помощью результатов выборки.
Гипотеза Н0 это любое предположение о признаке Х во всей генеральной совокупности.
Критерий согласия это правило, по которому эту гипотезу отвергаем или принимаем.
Для проверки гипотезы Н0 образуется выборка. С каждым критерием согласия связана некоторая случайная величина, которая называется статистикой данного критерия.
Закон распределения этой статистики, как правило, известен и затабулирован. При постановке задачи устанавливается уровень значимости ? (т.е. та вероятность, которую решено принять).
В соответствие с уровнем значимости ? по таблицам устанавливается критическое значение статистики критерия.
По результатам выборки вычисляется опытное (эмпирическое) значение этой статистики. Если опытное значение превосходит критическое, то гипотеза Н0 отвергается. В противном случае – не отвергается. При использовании критерия согласия для проверки гипотезы возникают 2 типа ошибок:
возможность отвергнуть правильную гипотезу;
возможность принять неверную гипотезу;
При выборе того или иного критерия согласия учитывается величина и характеристика ошибки, которая с ними связана.
Проверка гипотезы о нормальном законе распределения.
Критерий согласия Пирсона (критерий согласия EMBED Equation.DSMT4 (хи)).
Пусть закон распределения случайной величины Х во всей генеральной совокупности неизвестен. Образована выборка объема n. По результатам выборки получено значение EMBED Equation.DSMT4 . Данные выборки позволяют сформулировать гипотезу Н0 о том, что случайная величина Х имеет нормальный закон распределения с параметрами EMBED Equation.DSMT4 . Для проверки этой гипотезы применяется критерий согласия Пирсона, статистика которого
(1) EMBED Equation.DSMT4 , где
EMBED Equation.DSMT4 - вероятность того, что случайная величина заключена в интервале EMBED Equation.DSMT4 . И эти вероятности вычислены с предположением, что гипотеза Н0 верна, т.е. Х имеет нормальный закон распределения с параметрами EMBED Equation.DSMT4 . Тогда для вычисления EMBED Equation.DSMT4 можно применить формулу для нормального закона.
(2) EMBED Equation.DSMT4
Случайная величина EMBED Equation.DSMT4 имеет известный закон распределения, который затабулирован на странице 558.
Значение EMBED Equation.DSMT4 , полученное по ф. (1) – опытное (эмпирическое), т.к. получено по результатам выборки.
Критическое значение EMBED Equation.DSMT4 находим по таблице стр. 558 и определяется двумя параметрами ? и k, где
? – уровень значимости;
k – называется числом степеней свободы и равняется m = 3, где m – это количество интервалов признака в выборке.
Если EMBED Equation.DSMT4 , то EMBED Equation.DSMT4 (гипотеза о нормальном законе отвергается). В противном случае принимается.
Пример:
По результатам обследования 100 станков из 10000 для определения времени бесперебойной работы станка, получены данные, которые занесены в таблицу.
Проверить гипотезу Н0 о нормальном законе распределения случайной величины Х – времени бесперебойной работы станка. Применить критерий согласия EMBED Equation.DSMT4 при уровне значимости равном 0,05;
Выписать плотность вероятности и функцию распределения этой случайной величины;
Найти вероятность того, что время бесперебойной работы станка будет не менее 35 часов;
Построить гистограмму и кривую распределения этой случайной величины;
Дано:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4 ; EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
По таблице получено опытное значение EMBED Equation.DSMT4
По таблице на странице 558 получено критическое значение EMBED Equation.DSMT4
Опытное значение EMBED Equation.DSMT4 < EMBED Equation.DSMT4 , следовательно Н0 не отвергается.
2) EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
Неизвестные параметры ? и ? приближенно равны их выборочным оценкам EMBED Equation.DSMT4 . При достаточно большом объеме выборки в соответствии с законом больших чисел практически достоверно, что разница между оценкой и параметром сколь угодно мала.
3) EMBED Equation.DSMT4
EMBED Equation.DSMT4
Расхождение между теоретическим и опытным значением связано с тем, что изучалась не вся совокупность, а лишь ее часть.
Замечание:
Расхождение между теоретическими и опытными данными неизбежно, т.к. рассматривается лишь часть генеральной совокупности, однако, если расхождение велико, то это заставляет предполагать, что теоретическая модель неадекватна реальности.



Двумерная случайная величина.
Двумерной случайной величиной называется упорядоченная пара случайных величин EMBED Equation.DSMT4 .
Каждое значение двумерной случайной величины Z это упорядоченная пара чисел x и y. Вероятность этого значения это вероятность совместного наступления событий:
EMBED Equation.DSMT4
Пусть двумерная случайная величина Z принимает только дискретные значения, т.е. обе случайные величины x и y являются дискретными. Тогда каждое значение случайной величины Z определяется парой EMBED Equation.DSMT4 и характеризуется совместной вероятностью EMBED Equation.DSMT4 .
Закон распределения дискретной двумерной величины можно записать в виде таблицы, которая называется корреляционной таблицей и содержит значения случайных величин X и Y и их совместные вероятности.
таблица 1.
В нижней строчке таблицы стоят полные вероятности для каждого из значений Х.
(1) EMBED Equation.DSMT4
В крайнем правом столбце таблицы стоят полные вероятности для каждого из значений Y.
(2) EMBED Equation.DSMT4


Из каждой из составленной случайной величины можно составить отдельный закон распределения.
таблица 2.
EMBED Equation.DSMT4
таблица 3.
EMBED Equation.DSMT4
Для случайных величин X и Y по таблице 2 и 3 можно вычислить M и D по обычным формулам.
Пример № 1.
Пусть двумерная случайная величина Z (X; Y) задана корреляционной таблицей. Найти:
вероятность того, что P (Z), где Z (10;200)
M(X), D(X), ?(X)
M(Y), D(Y), ?(Y)
EMBED Equation.DSMT4

Р (10;200)=0,3

EMBED Equation.DSMT4 EMBED Equation.DSMT4

EMBED Equation.DSMT4 EMBED Equation.DSMT4
Для двумерной случайной величины вводят понятие условного распределения. Фиксируем какое-либо значение одной из случайных величин и находим условную вероятность для другой случайной величины.
(3) EMBED Equation.DSMT4 , где
EMBED Equation.DSMT4
- условная вероятность того, что EMBED Equation.DSMT4 при условии, что Y принимает значения i и j;
EMBED Equation.DSMT4 - совместная вероятность того, что EMBED Equation.DSMT4 , EMBED Equation.DSMT4 , т.е. EMBED Equation.DSMT4
EMBED Equation.DSMT4 - полная вероятность того, что Y приняло значение EMBED Equation.DSMT4 , т.е. EMBED Equation.DSMT4
(3) EMBED Equation.DSMT4
Аналогично можно определить условную вероятность того, что Y принимает значение EMBED Equation.DSMT4 при фиксированном значении Х.
(4) EMBED Equation.DSMT4
Пример № 1 (продолжение):
вычислить условную вероятность, что х = 30 при y = 100;
составить условное распределение для х при y = 200;
найти условную вероятность, что y = 100 при х = 20;
составить условное распределение для y при х = 10;
1) EMBED Equation.DSMT4
2) y = 200
EMBED Equation.DSMT4

3) EMBED Equation.DSMT4
4) x = 10
EMBED Equation.DSMT4

Условные математические ожидания.
Если построить условное распределение, т.е. ряд распределения одной случайной величины при фиксированном значении другой случайной величины, то можно для каждого из условных распределений посчитать математическое ожидание, которое называется условным математическим ожиданием.
Если фиксировано значение EMBED Equation.DSMT4 , то условное математическое ожидание для y вычисляется по формуле:
(5) EMBED Equation.DSMT4
Если фиксировано значение EMBED Equation.DSMT4 , то условное математическое ожидание для х определяется формулой:
(6) EMBED Equation.DSMT4
Пример № 1 (продолжение):
1) вычислить условное математическое ожидание для х при условии y = 200;
2) вычислить условное математическое ожидание для y при условии х = 10;
1) y = 200
EMBED Equation.DSMT4

EMBED Equation.DSMT4
2) x = 10
EMBED Equation.DSMT4

EMBED Equation.DSMT4
Условные математические ожидания являются функциями от той переменной, которая задает условия.
(7) EMBED Equation.DSMT4
Уравнения, выражающие зависимость условного математического ожидания от условия называются уравнениями регрессии, т.е. уравнения 7 это уравнения регрессии.
Виды зависимости между случайными величинами.
Функциональная – если каждому значению х соответствует единственное значение y.
Статистическая – если каждому значению х соответствует целый ряд распределения значения y (и наоборот). Такая зависимость задается корреляционной таблицей 1.
Корреляционная – это функциональная зависимость между значениями одной случайной величины и условными математическими ожиданиями другой случайной величины. Корреляционная зависимость выражается уравнениями регрессии.
Частота или мера корреляционной зависимости определяется корреляционным моментом.
Корреляционный момент это:
(8) EMBED Equation.DSMT4
Если случайны величины Х и Y независимы, то корреляционный момент равен 0. обратное неверно.
Если EMBED Equation.DSMT4 , то случайные величины называются не корреляционными.
Линейная регрессия.
Если уравнение регрессии является линейным, то говорят, что между x и y существует линейная корреляционная зависимость.
Линейная корреляционная зависимость задается следующими уравнениями зависимости:
(I) EMBED Equation.DSMT4 - I линейное уравнение регрессии y по х;
(II) EMBED Equation.DSMT4 - II линейное уравнение регрессии х по y;
Как правило параметры a, b, c, d неизвестны.
Чтобы их найти организуют случайную выборку и по результатам этой выборки методом наименьших квадратов определяют параметры a, b, c, d.
Мерой тесноты линейной корреляционной зависимости является коэффициент линейной корреляции.
(9) EMBED Equation.DSMT4



По результатам выборки неизвестные характеристики генеральной совокупности заменяются их выборочными оценками.
? – выборочный корреляционный момент
(10) EMBED Equation.DSMT4
(11) EMBED Equation.DSMT4 - выборочный коэффициент линейной корреляции;
EMBED Equation.DSMT4 - групповые средние y по x, т.е. средние значения y вычисленные при фиксированном значении x;
EMBED Equation.DSMT4 - групповые средние x по y, т.е. средние значения x вычисленные при фиксированном значении y;
Свойства коэффициента линейной корреляции.
r служит для определения тесноты линейной корреляционной зависимости;
r принимает значения от EMBED Equation.DSMT4 ;
если r = 0, то между х и y не существует линейной корреляционной зависимости (но может быть не линейная);
чем ближе модуль r к 1, тем теснее линейная корреляционная связь;
если EMBED Equation.DSMT4
если EMBED Equation.DSMT4 , то между х и y возникает функциональная зависимость. Обе прямые регрессии совпадают;

значение r совпадает со знаком ? (см. ф-лу 11);
Если EMBED Equation.DSMT4 , то между х и y существует прямая корреляционная зависимость, т.е. с ростом одной переменной другая, в среднем, тоже возрастает.
Если EMBED Equation.DSMT4 , то между х и y существует обратная корреляционная зависимость, т.е. с ростом значений одной переменной, другая, в среднем, убывает.





Нахождение параметров линейных уравнений регрессии методом наименьших квадратов.
После того, как сделана выборка, в линейных уравнениях регрессии I и II условные математические ожидания заменяются их оценками – групповыми средними. Тогда уравнения регрессии принимают следующий вид:
EMBED Equation.DSMT4 - I
EMBED Equation.DSMT4 - II
Метод наименьших квадратов состоит в том, что неизвестные параметры a и b – I, c, d – II находятся из принципа минимизации суммы квадратов расстояний от опытных точек, полученных по выборке, до теоретических точек, полученных соответственно по уравнениям I и II.
Для нахождения min указанной суммы, находятся частный производные и приравниваются к 0. Получается сумма уравнений, которые называются нормальными системами:
I EMBED Equation.DSMT4
Коэффициент а в уравнении регрессии I называют коэффициентом регрессии y по x и обозначается:
(12) EMBED Equation.DSMT4
Тогда уравнение регрессии I приобретает вид:
EMBED Equation.DSMT4 - I
В дальнейшем для удобства EMBED Equation.DSMT4 обозначается y и уравнение I приобретает вид:
EMBED Equation.DSMT4 - I, где
EMBED Equation.DSMT4
II аналогично с помощью M и K составляем систему нормальных уравнений для нахождения параметров c и d.
Коэффициент с обозначением EMBED Equation.DSMT4 называется коэффициентом регрессии x по y.
(13) EMBED Equation.DSMT4
Тогда уравнение регрессии II приобретает вид:
EMBED Equation.DSMT4 - II
В дальнейшем для удобства EMBED Equation.DSMT4 обозначается y и уравнение II приобретает вид:
EMBED Equation.DSMT4 - II, где
EMBED Equation.DSMT4

Свойства коэффициентов регрессии.
коэффициенты регрессии имеют одинаковый знак , совпадающий со знаком ?;
коэффициенты регрессии являются угловыми коэффициентами для соответствующих прямых I и II относительно соответствующих осей, поэтому, если ? > 0 и коэффициент регрессии отрицателен, то обе прямые наклонены налево.

Замечание: Прямые регрессии пересекаются в точке А с координатами EMBED Equation.DSMT4 .
Связь между коэффициентами корреляции и коэффициентами регрессии.
Сравнивая формулы 11, 12 и 13 получаем, что
EMBED Equation.DSMT4 , где значение r выбирается так, чтобы он совпадал со знаком ?.
Проверка значимости коэффициента корреляции.
Выдвигается гипотеза Н0, которая заключается в том, что между переменными х и y во всей генеральной совокупности не существует линейной корреляции не существует линейной корреляционной зависимости.
Коэффициент линейной корреляции R равен 0, а его оценка r не равна 0 только потому что вместо всей генеральной совокупности рассматривается выборка. Фактически EMBED Equation.DSMT4 по выборке ни о чем не говорит. Значение r не равное 0 не значимо. Т.е. проверяется гипотеза Н0: R = 0, линейной корреляционной связи нет. Для проверки этой гипотезы применяется t-критерий Стьюдента, статистика которого вычисляется по формуле:
(15) EMBED Equation.DSMT4
Эта статистика затабулирована в учебнике.
Критическое значение EMBED Equation.DSMT4 определяется 2-мя параметрами:
1 – ?, где ? – уровень значимости;
n – объем выборки;
Опытное, или эмпирическое, значение t определяется по формуле 15. Если t больше tкритич. , то гипотеза Н0 отвергается, т.е. значение EMBED Equation.DSMT4 значимо, между х и y существует линейная корреляционная зависимость.
Пример № 3:
10 участков земли обследуются с целью определения взаимосвязи между урожайностью Y и количеством внесенных удобрений Х. данные приведены в таблице. Предполагаем, что между переменными х и y существует корреляционная зависимость. Выполнить следующие задания:
1) Вычислить групповые средние для х и для y и изобразить их на корреляционном поле, построив эмпирические линии регрессии;
2) Написать уравнения регрессии х по y и y по x и построить их графики на том же чертеже.
3) Вычислить коэффициент корреляции r и проверить его значимость при ? = 0,05. сделать выводы о тесноте и направлении корреляционной связи.
4) Используя соответствующие уравнения регрессии вычислить среднюю урожайность когда количество удобрений равно 10 кг и сравнить с соответствующей средней.
1)
а) групповые средние y по x:
EMBED Equation.DSMT4


б) групповые средние x по y:
EMBED Equation.DSMT4

Предварительный анализ: по групповым средним построены эмпирические линии регрессии, точки которых образуют так называемое корреляционное поле. По результатам выборки можно предварительно заключить, что связь между переменными х и y прямая, т.е. с ростом значений одной переменной, групповые средние для другой переменной возрастают. Т.к. линии расположены близко друг к другу, можно предположить, что связь между х и y достаточно тесная.
2) для уравнений регрессии нужно вычислить:
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4 EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4 EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4

3) коэффициент линейной корреляции r можно вычислить по 2-м формулам:
EMBED Equation.DSMT4
Вывод:
т.к. EMBED Equation.DSMT4 , то между переменными х и y существует прямая зависимость, т.е. с ростом одной переменной, другая в среднем возрастает;
т.к. EMBED Equation.DSMT4 , то связь между х и y – тесная;
т.к. коэффициенты регрессии > 0, то обе прямые наклонены направо;
т.к. связь тесная, то угол между прямыми маленький, прямые близко расположены друг к другу;
Проверка значимости коэффициента корреляции.
EMBED Equation.DSMT4
EMBED Equation.DSMT4 .
Т.к. EMBED Equation.DSMT4 , то коэффициент корреляции r значим, между урожайностью и количеством удобрений существует тесная корреляционная зависимость;
4) Дано: Х = 10 – аргумент.
Выберем то уравнение регрессии, в котором х является аргументом. Это уравнение I. Подставляем туда 10 и получаем.
EMBED Equation.DSMT4
Такой будет средняя урожайность при 10 кг удобрений.
EMBED Equation.DSMT4 значит модель адекватна действительности.

Замечания:
по уравнениям регрессии I и II можно делать прогнозы, однако эти прогнозы адекватны реальности (соответствуют действительности) только вблизи центра корреляционного поля (точки EMBED Equation.DSMT4 );
если предположить, что между х и y существует не линейная корреляционная зависимость, т.е. уравнения I и II не линейные, то их неизвестные параметры тоже можно найти методом наименьших квадратов.