ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
ОТЧЕТ
о результатах выполнения
компьютерной лабораторной работы № 1
«Автоматизированный априорный анализ
статистической совокупности в среде MS Excel»
Вариант № 22
ВОРОНЕЖ 2005
Постановка задачи
Имеются следующие выборочные данные по предприятиям одной из отраслей промышленности региона в отчетном году ( выборка 20 % - ная механическая ), млн.руб.:
Таблица № 1
№ предприятия п/п
Выручка от продажи продукции
Затраты на производство и реализацию продукции

1
36,450
30,255

2
23,400
20,124

3
46,540
38,163

4
59,752
47,204

5
41,415
33,546

6
26,860
22,831

7
79,200
60,984

8
54,720
43,776

9
40,424
33,148

10
30,210
25,376

11
42,418
34,359

12
64,575
51,014

13
51,612
41,806

14
35,420
29,753

15
14,400
12,528

16
36,936
31,026

17
53,392
42,714

18
41,000
33,620

19
55,680
43,987

20
18,200
15,652

21
31,800
26,394

22
39,204
32,539

23
57,128
45,702

24
28,440
23,890

25
43,344
35,542

26
70,720
54,454

27
41,832
34,302

28
69,345
54,089

29
35,903
30,159

30
50,220
40,678


В проводимом статистическом исследованные предприятия выступает как единицы выборочной совокупности, а показатели Выручка от продажи продукции и Затраты на производство и реализацию продукции – изучаемые признаки единиц.
Задание 1. Выявление и исключение из выборки аномальных единиц наблюдения.
Построение диаграммы рассеяния изучаемых признаков.
Визуальный анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков и их удаление из первичных данных.
Выявление аномальных значений признака наиболее удобно производить графическим методом. Для визуального анализа разброса единиц совокупности можно использовать различные типы графиков, в том числе точечный график. По расположению точек на точечном графике легко выявить значения признака, которые резко выделяются из общей, однородной массы значений признаков единиц совокупности.
В настоящей лабораторной работе в качестве исходных данных представлены выборочные значения двух признаков - Выручка от продажи продукции и Затраты на производство и реализацию продукции. Для выявления аномальных значений этих признаков можно построить график для каждого из признаков в отдельности, однако анализ упростится, если использовать диаграмму рассеяния.
Диаграмма рассеяния – это точечный график, осям X и Y которого сопоставлены два изучаемых признака единиц совокупности. В случае, если признаки X и Y являются взаимосвязанными, диаграмму рассеяния принято называть корреляционным полем.
При построении диаграммы рассеяния по оси X следует расположить значения признака Выручка от продажи продукции, а по оси Y – соответствующие значения признака Затраты на производство и реализацию продукции.
Построение диаграммы рассеяния в среде Excel осуществляется с помощью инструмента построения графика Мастер диаграмм.
При построении точечного графика в режиме Мастер диаграмм данные первого выделенного столбца (Выручка от продажи продукции) автоматически сопоставляются оси X, данные второго выделенного столбца (Затраты на производство и реализацию продукции) – оси Y.

Рис. 1 . Диаграмма рассеяния
Полученный график можно произвольно перемещать по полю рабочего листа, изменять его размеры. Для перемещения графика в удобное для просмотра место следует осуществить так называемый «захват мышью», т.е. установить курсор на произвольное место белой области графика, нажать левую кнопку мыши и , удерживая ее, переместить график в требуемое место, затем отпустить клавишу. Для изменения размеров графика производятся аналогичные действия, однако местом «захвата мышью» должен быть один из углов графика.
В данной задаче отсутствуют аномальные значения прзнаков.
Задание 2. Оценка описательных статистических параметров совокупности.
Расчет описательных показателей выборочной и генеральной совокупностей по несгруппированным выборочным данным с использованием инструментов Описательная статистика и Мастер функций.
Оценка средней и предельной ошибок выборки для средней величины признака, а также границ, в которых эта средняя будет находиться в генеральной совокупности при заданных уровнях надежности.
Описательная (дескриптивная) статистика является инструментом статистического описания данных, представляющих всю наблюдаемую совокупность в целом. Цель описательной статистики – получение сводных (обобщающих) показателей, характеризующих исходную совокупность данных как генеральную ( а не как выборку из некоторой другой совокупности большего объема).
Для численной оценки обобщающих показателей совокупности используются так называемые описательные статистики, представляющие собой однозначные функции на множестве наблюдаемых данных, определяющие значения оцениваемых обобщающих показателей совокупности.
Описательные статистики рассчитываются по несгруппированным данным и реализуют точные функциональные зависимости значений показателей от исходных данных ( в отличие от приближенных статистических оценок, выводимых с заданным уровнем надежности).
Показатели, вычисляемые с помощью описательных статистик ( так называемые описательные параметры), можно разбить на 3 группы - показатели положения вариантов значений признака, вариации признака и особенностей формы его распределения.
Между терминологией инструмента Описательная статистика и терминами, принятыми в отечественной статистике, имеется ряд расхождений. Согласование терминологии приводится в табл. 2.
СТАТИСТИЧЕКАЯ ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ
Таблица № 2
Параметр инструмента ОПИСАТЕЛЬНАЯ СТАТИСТИКА
Статистический показатель
Обозна-чение

Среднее
Средняя арифметическая величина признака в выборке, вычисленная по несгруппированным данным


Стандартная ошибка
Средняя ошибка выборки - среднее квадратическое отклонение выборочной средней x от математического ожидания генеральной средней x


Медиана
Значение признака, приходящееся на середину ранжированного ряда выборочных данных
Ме

Мода
Значение признака, повторяющееся в выборке с наибольшей частотой
Мо

Стандартное отклонение
Генеральное среднее квадратическое отклонение, оцененное по выборке
 

Дисперсия выборки
Генеральная дисперсия, оцененная по выборке
 

Эксцесс
Коэфициент эксцесса, оценивающий по выборке значение эксцесса в генеральной совокупности
 

Асимметричность
Коэффициент асимметрии, оценивающий по выборке величину асимметрии в генеральной совокупности
 

Интервал
Размах вариации в выборке
 R

Минимум
Минимальное значение признака в выборке
 xmin

Максимум
Максимальное значение признака в выборке
 xmax

Сумма
Суммарное значение элементов выборки
 

Счет
Объем выборки
 n

Уровень надежности (95,0%)
Предельная ошибка выборки, оцененная с заданным уровнем надежности
 


Запуск инструмента Описательная статистика осуществляется следующей последовательностью действий6


Рис. 2. Диалоговое окно инструмента ОПИСАТЕЛЬНАЯ СТАТИСТИКА
Алгоритм 1. Расчет описательных статистик

Входной интервал диапазон ячеек таблицы (Выручка от продажи продукции и Затраты на производство и реализацию продукции);
Группирование по столбцам;
Итоговая статистика – Активизировать;
Уровень надежности – Активизировать;
Уровень надежности 95,4;
Выходной интервал адрес ячейки заголовка первого столбца;
ОК;
В результате указанных действий Excel осуществляет вывод таблицы статистик в заданный диапазон рабочего файла.
Таблица № 3
Описательные статистики

Выручка от продажи продукции
 
Затраты на производство и реализацию продукции
 

Столбец1
 
Столбец2
 

 
 
 
 

Среднее
44,018
Среднее
35,65383333

Стандартная ошибка
2,84221741
Стандартная ошибка
2,110120473

Медиана
41,6235
Медиана
33,961

Мода
44,018
Мода
35,65383333

Стандартное отклонение
15,56746589
Стандартное отклонение
11,55760582

Дисперсия выборки
242,3459942
Дисперсия выборки
133,5782523

Эксцесс
-0,173304824
Эксцесс
-0,194290267

Асимметричность
0,299416025
Асимметричность
0,161678258

Интервал
64,8
Интервал
48,456

Минимум
14,4
Минимум
12,528

Максимум
79,2
Максимум
60,984

Сумма
1320,54
Сумма
1069,615

Счет
30
Счет
30

Уровень надежности(95,4%)
5,925488871
Уровень надежности(95,4%)
4,399204414


Алгоритм 2. Расчет предельной ошибки выборки при Р = 0,683

Входной интервал диапазон ячеек таблицы (Выручка от продажи продукции и Затраты на производство и реализацию продукции);
Итоговая статистика – Снять флажок;
Уровень надежности – Активизировать;
Уровень надежности 68,3;
Выходной интервал адрес ячейки , для предельной ошиб