ПРИЛОЖЕНИЕ 1
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности
в среде MS Excel»
Вариант №____
Выполнил: ст. III курса гр.________
_____________________
Ф.И.О.
Проверил:________ ___________
Должность Ф.И.О.
Москва, 2005 г.
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Для демонстрационного примера (ДП) выборочные данные приведены в табл. 1-ДП.
Таблица 1-ДП
Исходные данные демонстрационного примера
Номер предприятия
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.
Номер предприятия

1
18026
17201
1

2
21199
18871
2

3
21867
21042
3

4
23036
23380
4

5
15020
11690
5

6
24205
20040
6

7
24873
27054
7

8
18694
18370
8

9
22869
21543
9

10
26376
26887
10

11
28881
28390
11

12
10010
25050
12

13
22034
22378
13

14
24205
24382
14

15
27712
29559
15

16
31720
31730
16

17
23704
21376
17

18
26209
25384
18

19
20865
15865
19

20
26543
21710
20

21
29549
29225
21

22
20364
16533
22

23
16189
15531
23

24
27044
24883
24

25
24205
21710
25

26
22535
20541
26

27
17525
13360
27

28
23537
20875
28

29
27211
22879
29

30
25875
21710
30

31
31720
8350
31

32
19028
19372
32


В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения – линейное () и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности
Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Решение задачи в MS Excel




РЕШЕНИЕ
Анализ показал, что в исходных данных имеются аномальные значения.

Таблица 2

Аномальные единицы наблюдения

Номер предприятия
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.

12
10010
25050

31
31720
8350


Для проведения анализа исключим эти аномальные значения признаков из совокупности.
Анализ статистических показателей совокупности по показателю «Среднегодовая стоимость основных производственных фондов, тыс.руб.» представлен в таблицах 3 – 5 файлов MS Excel.
Описательная (дескриптивная) статистика является инструментом статистического описания данных, представляющих всю наблюдаемую совокупность в целом. Цель описательной статистики – получение сводных (обобщающих) показателей, характеризующих исходную совокупность данных как генеральную (а не как выборку из некоторой другой совокупности большего объема).
Показатели, вычисляемые с помощью описательных статистик (так называемые описательные параметры), можно разбить на 3 группы - показатели положения вариантов значений признака, вариации признака и особенностей формы его распределения.
Показатели положения описывают положение в первичном ряде данных тех или иных вариантов значений признака, характеризующих ряд. К ним относятся:
максимальное xmax и минимальное xmin значения признака;
средняя арифметическая величина (выступающая в качестве статистической оценки математического ожидания M[] средней величины признака);
мода Мо - наиболее часто встречающийся вариант значений признака или тот вариант, который соответствует максимальной ординате эмпирической кривой распределения;
медиана Ме - серединное значение ранжированного ряда вариантов значений признака;
нижний и верхний квартили Q1 и Q3, ограничивающие центральную зону ранжированного ряда, в которую попадают 50% вариантов значений признака: 25% вариантов значений меньших серединного значения Ме и 25% вариантов значений больших Ме
Среди показателей этой группы наиболее часто используются показатели центра распределения - , Mo и Me. При этом рассчитывается для первичного ряда наблюдаемых данных, Mo и Me - для ранжированного (упорядоченного) ряда.
Для и Me характерны свойства:
,
Показатели вариации (колеблемости) признака описывают степень рассеяния вариантов значений признака относительно своего центра (или Ме). Различают показатели размера и интенсивности вариации. К показателям размера вариации относятся:
размах вариации R= xmax - xmin, устанавливающий предельное значение амплитуды колебаний признака;
межквартильный размах Q3-Q1, определяющий максимальную амплитуду колебаний в центральной зоне ряда (ограниченной квартилями Q1 и Q3);
среднее линейное отклонение , вычисляемое как среднее арифметическое из абсолютных отклонений |xi -|:

дисперсия (2 (или D), рассчитываемая как среднее арифметическое из квадратов отклонений (xi -):

среднее квадратическое (стандартное) отклонение (, вычисляемое как корень квадратный из дисперсии (2:

Интенсивность вариации признака измеряется относительными показателями
V(= , Vd= , VR= , VMe=.
Показатели R, и ( являются величинами именованными и выражаются в тех же единицах, что и изучаемый признак. Дисперсия (2 считается безразмерной величиной. Относительные показатели интенсивности вариации, как правило, измеряются в процентах.
Показатели (2, (, основанные на учете отклонений (xi-) индивидуальных значений признака xi от средней арифметической , являются обобщающими характеристиками различия в значениях признака.
Дисперсия (2 оценивает средний квадрат отклонений (xi -). Величина ( очень чутко реагирует на вариацию признака (за счет возведения отклонений в квадрат) и органически вписывается в аппарат математической статистики (дисперсионный, корреляционный анализ и др.). На расчете дисперсии основаны многие статистические показатели.
Среднее квадратическое отклонение ( показывает, на сколько в среднем отклоняются индивидуальные значения признака xi от их средней