Министерство науки и образования Украины
Национальный технический университет Украины
«Киевский Политехнический Институт»
Факультет социологии и права
Лабораторная работа №2
по теории вероятности
на тему:
«Обработка базы данных с помощью
Microsoft Office Excel»
Выполнил
Студент 2-го курса
группы АМ-74
Балашов Дмитрий Валерьевич
Проверила
Бахтина Галина Петровна
Киев 2008
ЦЕЛЬ РАБОТЫ
При помощи компьютерной программы Microsoft Excel научится:
Находить вероятность случайных событий;
Находить условную вероятность событий;
Делать выборку из базы данных при указанном условии;
Строить дерево вероятности для указанной выборки;
Определять независимые и несовместимые события.
ЗАДАНИЕ РАБОТЫ
1. Приведенная ниже база данных служащих является выборочным пространством некоторого случайного эксперимента, в котором работник выбирается выборочным(случайным) способом. Будем считать, что один работник представляет один результат эксперимента и все возможные результаты равновероятны.
1.1) найти вероятность того, что будет выбрана женщина;
1.2) найти вероятность того, что зарплата работника превышает $ 35000;
1.3) найти вероятность того, что работник имеет уровень подготовки В;
1.4) найти вероятность того, что зарплата превышает $ 35000 и работник имеет уровень подготовки В;
1.5) найти вероятность того, что зарплата превышает $ 35000 при условии, что работник имеет уровень подготовки В.
2. База данных служащих также выборочное пространство некоторого
случайного эксперимента. Рассмотрим два события: «большой опыт работы»( 6 лет и больше) и «служащий – женщина».
2.1) найти вероятность этих двух событий;
2.2) найти вероятность пересечения этих двух событий и дать интерпретацию этого пересечения;
2.3) построить дерево вероятности для этих двух событий, выбрав в качестве первой ветви «служащий-женщина»;
2.4) найти условную вероятность наличия большого опыта работы при условии, что служащий-женщина;
2.5) найти условную вероятность того, что служащий-женщина при наличии большого опыта работы;
2.6) найти условную вероятность того, что служащий-женщина не имеющая большого опыта работы;
2.7) являются ли эти два события независимыми? Откуда это следует?
2.8) являются ли эти два события несовместными? Откуда это следует?
3. Снова считаем вышеупомянутую базу данных выборочным пространством
3.1) являются ли события «Уровень подготовки А» и «Уровень подготовки В» независимыми? Откуда это следует?
3.2) являются ли события «Уровень подготовки А» и «Уровень подготовки В» несовместными? Откуда это следует?
БАЗА ДАННЫХ СЛУЖАЩИХ
Номер служащего
Заработная плата за год, долл.
Пол
Возраст, лет
Стаж роботы, лет
Уровень подготовки

1
32368
Ж
42
3
B

2
53174
Ч
54
10
B

3
52722
Ч
47
10
A

4
53423
Ч
47
1
B

5
50602
Ч
44
5
B

6
49033
Ч
42
10
A

7
24395
Ч
30
5
A

8
24395
Ж
52
6
A

9
43124
Ч
48
8
A

10
23978
Ж
58
4
A

11
53174
Ч
46
4
C

12
58515
Ч
36
8
C

13
56194
Ч
49
10
B

14
49037
Ж
55
10
B

15
44884
Ч
41
1
A

16
53429
Ж
52
5
B

17
46578
Ч
57
8
A

18
58968
Ж
61
10
B

19
53174
Ч
50
5
A

20
53627
Ч
47
10
B

21
49033
Ч
54
5
B

22
54981
Ч
47
7
A

23
62530
Ч
50
10
B

24
27525
Ж
38
3
A

25
24395
Ч
31
5
A

26
56884
Ч
47
10
A

27
52115
Ч
56
5
A

28
44183
Ж
38
5
B

29
24971
Ж
55
6
A

30
35423
Ж
47
4
A

31
41188
Ж
35
2
B

32
27525
Ж
35
3
A

33
35018
Ч
39
1
A

34
44183
Ч
41
2
A

35
35423
Ч
44
1
A

36
49033
Ч
53
8
A

37
40741
Ч
47
2
A

38
49033
Ч
42
10
A

39
56294
Ж
44
6
C

40
47180
Ж
45
5
C

41
46578
Ч
56
8
A

42
52722
Ч
38
8
C

43
51241
Ч
58
2
B

44
53627
Ч
52
8
A

45
53174
Ч
54
10
A

46
56294
Ч
49
10
B

47
49033
Ж
53
10
B

48
51241
Ч
56
1
C

49
35200
Ж
38
1
B

50
50174
Ж
42
5
A

51
24352
Ж
35
1
A

52
47180
Ж
40
3
A

53
49033
Ж
34
4
B

54
53174
Ж
35
1
A

55
53429
Ж
45
5
B

56
53627
Ч
54
10
A

57
26491
Ч
47
10
A

58
42961
Ж
45
7
B

59
53627
Ч
47
10
A

60
26491
Ж
46
7
A

61
42961
Ч
36
3
B

62
53174
Ч
45
5
A

63
36292
Ч
46
0
A

64
37292
Ч
47
1
A

65
41188
Ж
34
3
B

66
57242
Ж
45
7
C

67
53429
Ж
44
6
C

68
53174
Ч
50
10
B

69
44138
Ж
38
2
B

ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ
Вероятность события – это отношение числа благоприятствующих этому событию исходов к общему числу всех равновозможных несовместимых элементарных исходов, образующих полную группу.
События обозначаются заглавными буквами латинского алфавита: A, В, С, ...
Пересечением называется такое событие, которое наступает при одновременном наступлении событий А и В.
Случайным событием (или просто событием) называется всякое явление, которое может произойти или не произойти при осуществлении определенной совокупности условий. Теория вероятностей имеет дело с такими событиями, которые имеют массовый характер. Это значит, что данная совокупность условий может быть воспроизведена неограниченное число раз. Каждое такое осуществление данной совокупности условий называют испытанием (или опытом).
Пусть при n испытаниях событие A появилось m раз. Тогда отношение называется частотой (относительной частотой) события A и обозначается как:

Событие называется достоверным, если оно в данном опыте обязательно должно произойти; наоборот, событие называется невозможным, если оно в данном опыте не может произойти.
Два события A и В называются несовместными, если наступление события A исключает наступление события В. Отсюда следует, что если события A и В несовместны, то событие AB — невозможное.
Событие В называется независимым от события А, если появление события А не изменяет вероятности появления события В.
Условная вероятность – вероятность события В, вычесленная в предположении, что событие А уже наступило.
Дерево вероятности – наглядное описаниевероятности события.
ВЫПОЛНЕНИЕ РАБОТЫ
ЗАДАНИЕ 1
Для того, чтобы начать выполнение работы, нам необходимо открыть нашу базу данных в программе Microsoft Excel 2007. А также включить фильтр: Данные – Фильтр.

ЗАДАНИЕ 1.1
Фильтруем данные в столбце «Пол». Для этого нажимаем на стрелочку и из предложенного списка критерием выбираем «ж».

После проделывания данных операций мы получаем отфильтрованные данные и на экран выводится такая таблица.
Номер служащего
Заработная плата за год, долл.
Пол
Возраст, лет
Стаж роботы, лет
Уровень подготовки

1
32368
Ж
42
3
B

7
24395
Ж
52
6
A

10
23978
Ж
58
4
A

14
49033
Ж
55
10
B

16
53429
Ж
52
5
B

18
58968
Ж
61
10
B

24
27525
Ж
38
3
A

28
44183
Ж
38
5
B

29
24971
Ж
55
6
A

30
35423
Ж
47
4
A

31
41188
Ж
35
2
B

32
27525
Ж
35
3
A

39
56294
Ж
44
6
C

40
47180
Ж
45
5
C

47
49033
Ж
53
10
B

49
35200
Ж
38
1
B

50
50174
Ж
42
5
A

51
24352
Ж
35
1
A

52
47180
Ж
40
3
A

53
49033
Ж
34
4
B

54
53174
Ж
35
1
A

55
53429
Ж
45
5
B

58
42961
Ж
45
7
B

60
26491
Ж
46
7
A

65
41188
Ж
34
3
B

66
57242
Ж
45
7
C

67
53429
Ж
44
6
C

69
44138
Ж
38
2
B

В низу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.
Теперь, когда у нас есть все необходимые данные, преступаем к вычислению вероятности. Для этого воспользуемся формулой, приведенной в теоретических сведеньях, и для получений процентного отношения умножаем на 100%.
Вероятность: (28/69)*100%=0,4057*100%=40,6%
ЗАДАНИЕ 1.2
Фильтруем данные в столбце «Заработная плата за год, долл.». Для этого нажимаем на стрелочку и из списка появившихся условий выбираем: Числовые фильтры > больше…

В появившемся диалоговом окне в верхнее правое поле вводим минимальную сумму – 35000 и нажимаем ОК.

После проделывания данных операций мы получаем отфильтрованные данные и на экран выводится такая таблица.
Номер служащего
Заработная плата за год, долл.
Пол
Возраст, лет
Стаж роботы, лет
Уровень подготовки

2
53174
Ч
54
10
B

3
52722
Ч
47
10
A

4
53423
Ч
47
1
B

5
50602
Ч
44
5
B

6
49033
Ч
42
10
A

9
43124
Ч
48
8
A

11
53174
Ч
46
4
C

12
58515
Ч
36
8
C

13
56194
Ч
49
10
B

14
49037
Ж
55
10
B

15
44884
Ч
41
1
A

16
53429
Ж
52
5
B

17
46578
Ч
57
8
A

18
58968
Ж
61
10
B

19
53174
Ч
50
5
A

20
53627
Ч
47
10
B

21
49033
Ч
54
5
B

22
54981
Ч
47
7
A

23
62530
Ч
50
10
B

26
56884
Ч
47
10
A

27
52115
Ч
56
5
A

28
44183
Ж
38
5
B

30
35423
Ж
47
4
A

31
41188
Ж
35
2
B

33
35018
Ч
39
1
A

34
44183
Ч
41
2
A

35
35423
Ч
44
1
A

36
49033
Ч
53
8
A

37
40741
Ч
47
2
A

38
49033
Ч
42
10
A

39
56294
Ж
44
6
C

40
47180
Ж
45
5
C

41
46578
Ч
56
8
A

42
52722
Ч
38
8
C

43
51241
Ч
58
2
B

44
53627
Ч
52
8
A

45
53174
Ч
54
10
A

46
56294
Ч
49
10
B

47
49033
Ж
53
10
B

48
51241
Ч
56
1
C

49
35200
Ж
38
1
B

50
50174
Ж
42
5
A

52
47180
Ж
40
3
A

53
49033
Ж
34
4
B

54
53174
Ж
35
1
A

55
53429
Ж
45
5
B

56
53627
Ч
54
10
A

58
42961
Ж
45
7
B

59
53627
Ч
47
10
A

61
42961
Ч
36
3
B

62
53174
Ч
45
5
A

63
36292
Ч
46
0
A

64
37292
Ч
47
1
A

65
41188
Ж
34
3
B

66
57242
Ж
45
7
C

67
53429
Ж
44
6
C

68
53174
Ч
50
10
B

69
44138
Ж
38
2
B

Внизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.
Теперь, когда у нас есть все необходимые данные, преступаем к вычислению вероятности. Для этого воспользуемся формулой, приведенной в теоретических сведеньях, и для получений процентного отношения умножаем на 100%.
Вероятность: (58/69)*100%=0,8405*100%=84,1%
ЗАДАНИЕ 1.3
Фильтруем данные в столбце «Уровень подготовки». Для этого нажимаем на стрелочку и из списка появившихся критериев выбираем «В».

После проделывания данных операций мы получаем отфильтрованные данные и на экран выводится такая таблица.
Номер служащего
Заработная плата за год, долл.
Пол
Возраст, лет
Стаж роботы, лет
Уровень подготовки

1
32368
Ж
42
3
B

2
53174
Ч
54
10
B

4
53423
Ч
47
1
B

5
50602
Ч
44
5
B

13
56194
Ч
49
10
B

14
49036
Ж
55
10
B

16
53429
Ж
52
5
B

18
58968
Ж
61
10
B

20
53627
Ч
47
10
B

21
49033
Ч
54
5
B

23
62530
Ч
50
10
B

28
44183
Ж
38
5
B

31
41188
Ж
35
2
B

39
56294
Ч
49
10
B

38
49033
Ж
53
10
B

43
51240
Ч
58
2
B

49
35200
Ж
38
1
B

53
49033
Ж
34
4
B

55
53429
Ж
45
5
B

58
42961
Ж
45
7
B

61
42961
Ч
36
3
B

65
41188
Ж
34
3
B

68
53174
Ч
50
10
B

69
44138
Ж
38
2
B

ВНнизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.
Теперь, когда у нас есть все необходимые данные, преступаем к вычислению вероятности. Для этого воспользуемся формулой, приведенной в теоретических сведеньях, и для получений процентного отношения умножаем на 100%.
Вероятность: (24/69)*100%=0,3478*100%=34,8%
ЗАДАНИЕ 1.4
Фильтруем данные последовательно в столбцах «Заработная плата за год, долл.»: Числовые фильтры > больше > в диалоговом окне пишем 35000 > ОК; и «Уровень подготовки»: выбираем условие «В». В результате фильтрации получаем такую таблицу:
Номер служащего
Заработная плата за год, долл.
Пол
Возраст, лет
Стаж роботы, лет
Уровень подготовки

2
53174
Ч
54
10
B

4
53423
Ч
47
1
B

5
50602
Ч
44
5
B

13
56194
Ч
49
10
B

14
49033
Ж
55
10
B

16
53429
Ж
52
5
B

18
58968
Ж
61
10
B

20
53627
Ч
47
10
B

21
49033
Ч
54
5
B

23
62530
Ч
50
10
B

28
44183
Ж
38
5
B

31
41188
Ж
35
2
B

43
51240
Ч
58
2
B

46
56294
Ч
49
10
B

47
49033
Ж
53
10
B

49
35200
Ж
38
1
B

53
49033
Ж
34
4
B

55
53429
Ж
45
5
B

58
42961
Ж
45
7
B

61
42961
Ч
36
3
B

65
41188
Ж
34
3
B

68
53174
Ч
50
10
B

69
44138
Ж
38
2
B

Внизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.
Для нахождения вероятности делим полученный результат (23) на количество работников получающих зарплату больше $35000 (58) и умножаем на 100%.
Вероятность: (23/58)*100%=0,3965*100%=39,7%
ЗАДАНИЕ 1.5
1.5) Выполняем действия аналогичные действиям в пункте (1.4). Но полученный результат (23) делим на количество работников с уровнем подготовки «В» (24) и умножаем на 100%.
Вероятность: (23/24)*100%=0,9583*100%=95,8%
ЗАДАНИЕ 2
ЗАДАНИЕ 2.1
Фильтруем данные в столбце «Стаж работы, лет». Для этого нажимаем на стрелочку и из списка появившихся критериев выбираем: Числовые фильтры > больше или равно > в появившемся диалоговом окне пишем «6» > ОК.

В результате фильтрации получаем такую таблицу
Номер служащего
Заработная плата за год, долл.
Пол
Возраст, лет
Стаж роботы, лет
Уровень подготовки

2
53174
Ч
54
10
B

3
52722
Ч
47
10
A

6
49033
Ч
42
10
A

7
24395
Ж
52
6
A

9
43124
Ч
48
8
A

12
58515
Ч
36
8
C

13
56194
Ч
49
10
B

14
49033
Ж
55
10
B

17
46574
Ч
57
8
A

18
58968
Ж
61
10
B

20
53627
Ч
47
10
B

22
54981
Ч
47
7
A

23
62530
Ч
50
10
B

26
56884
Ч
47
10
A

29
24971
Ж
55
6
A

36
49033
Ч
53
8
A

41
46577
Ч
56
8
A

42
52722
Ч
38
8
C

44
53627
Ч
52
8
A

45
53174
Ч
54
10
A

46
56294
Ч
49
10
B

47
49033
Ч
42
10
A

56
53627
Ч
54
10
A

57
26491
Ч
47
10
A

58
42961
Ж
45
7
B

59
53627
Ч
47
10
A

60
26491
Ж
46
7
A

66
57242
Ж
45
7
C

67
53429
Ж
44
6
C

68
53174
Ч
50
10
B

Внизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.
Для нахождения вероятности делим полученный результат (32) на общее количество работников (69) и умножаем на 100%.
Вероятность: (32/69)*100%=0,4637*100%=46,4%
Вероятность того, что работник - женщина берем из задания (1.1), и она равна 40,6%.
ЗАДАНИЕ 2.2
Для того, чтобы найти вероятность пересечения обоих этих событий нам необходимо перемножить вероятности этих событий.
Вероятность: (0,4057*0,4637)*100%=0,1881*100%=18,8%
ЗАДАНИЕ 2.3
Строим дерево вероятности, которое выглядит следующим образом:
Дерево вероятности см. на следующей странице.
большой опыт работы 18,8%
работник – женщина 40,6%
маленький опыт работы 21,8%
большой опыт работы 31,9%
работник-мужчина 59,4%
маленький опыт работы 27,5%
ЗАДАНИЕ 2.4
Фильтруем данные последовательно в столбцах «Пол»: выбираем условие «ж»; и «Стаж работы, лет»: Числовые фильтры > больше или равно > в диалоговом окне пишем 6 > ОК. В результате фильтрации получаем такую таблицу:
Номер служащего
Заработная плата за год, долл.
Пол
Возраст, лет
Стаж роботы, лет
Уровень подготовки

8
24395
Ж
52
6
A

14
49033
Ж
55
10
B

18
58968
Ж
61
10
B

29
24971
Ж
55
6
A

39
56294
Ж
44
6
C

47
49033
Ж
53
10
B

58
42961
Ж
45
7
B

60
26491
Ж
46
7
A

66
57242
Ж
45
7
C

67
53429
Ж
44
6
C

Для нахождения вероятности делим полученный результат (10) на количество всех работников-женщин (28) и умножаем на 100%.
Вероятность: (10/28)*100%=0,3571*100%=35,7%
ЗАДАНИЕ 2.5
Выполняем действия аналогичные действиям в пункте (2.4). Но полученный результат (10) делим на количество работников имеющих большой опыт работы (32) и умножаем на 100%.
Вероятность: (10/32)*100%=0,3125*100%=31,3%
ЗАДАНИЕ 2.6
Фильтруем данные последовательно в столбцах «Пол»: выбираем условие «ж»; и «Стаж работы, лет»: Числовые фильтры > меньше > в диалоговом окне пишем 6 >ОК.

В результате фильтрации получаем такую таблицу:
Номер служащего
Заработная плата за год, долл.
Пол
Возраст, лет
Стаж роботы, лет
Уровень подготовки

1
32368
Ж
42
3
B

10
23978
Ж
58
4
A

16
53429
Ж
52
5
B

24
27525
Ж
38
3
A

28
44183
Ж
38
5
B

30
35423
Ж
47
4
A

31
41188
Ж
35
2
B

32
27525
Ж
35
3
A

40
47180
Ж
45
5
C

49
35200
Ж
38
1
B

50
50174
Ж
42
5
A

51
24352
Ж
35
1
A

52
47180
Ж
40
3
A

53
49033
Ж
34
4
B

62
53174
Ж
35
1
A

67
53429
Ж
45
5
B

65
41188
Ж
34
3
B

69
44138
Ж
38
2
B

Внизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.
Для нахождения вероятности делим полученный результат (18) на общее количество работников не имеющих большого опыта работы (оно равняется
69 - 32 = 37)и умножаем на 100%.
Вероятность: (18/37)*100%=0,4864*100%=48,6%
ЗАДАНИЕ 2.7
Эти два события являются независимыми, так как не все работники, имеющие большой опыт работы – женщины, а также - не все женщины имеют большой опыт работы.
ЗАДАНИЕ 2.8
Эти события не являются несовместимыми, так как вероятность их пересечения равна 18.8%, то есть больше 0.
ЗАДАНИЕ 3
ЗАДАНИЕ 3.1
Представленные два события(«уровень подготовки А» и «уровень подготовки В») – независимые, так как в результате испытания может присутствовать только одно из них, а не оба сразу.
ЗАДАНИЕ 3.2
Эти события – несовместимые, так как, если приходит одно из этих событий, то появление в этом же испытании второго события является невозможным.
ВЫВОДЫ
После выполнения данной работы оказалось, что программа Microsoft Excel – очень удобный и быстрый способ обработки данных обширных и не очень баз данных. С помощью фильтрации (выборки) общей базы данных полученный результат можно использовать для нахождения вероятности случайных событий. Помимо этого - научились строить дерево вероятностей случайных событий, а также определять независимые и несовместные события.