ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности
в среде MS Excel»
Вариант №_1__
Выполнил: ст. III курса
Специальность
№ ЛИЧНОГО ДЕЛА
Проверил:________ ___________
Должность Ф.И.О.
Брянск, 2008 г.
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Таблица 1
Исходные данные
A
B
C

3
Номер единицы наблюдения
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.

4
1
98.00
103.00

5
2
117.00
113.00

6
3
121.00
126.00

7
4
128.00
140.00

8
5
80.00
70.00

9
6
135.00
120.00

10
7
139.00
162.00

11
8
102.00
110.00

12
9
127.00
129.00

13
10
148.00
161.00

14
11
163.00
170.00

15
12
122.00
134.00

16
13
135.00
146.00

17
14
156.00
177.00

18
15
180.00
190.00

19
16
132.00
128.00

20
17
147.00
152.00

21
18
115.00
95.00

22
19
149.00
130.00

23
20
167.00
175.00

24
21
112.00
99.00

25
22
87.00
93.00

26
23
152.00
149.00

27
24
135.00
130.00

28
25
125.00
123.00

29
26
95.00
80.00

30
27
131.00
125.00

31
28
153.00
137.00

32
29
145.00
130.00

33
30
104.00
116.00


В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения – линейное () и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности
Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Статистический анализ выборочной совокупности
1. Количество аномальных единиц наблюдения – 2, согласно табл.2:
предприятие №31 со среднегодовой стоимостью производственных фондов – 180 млн.руб. и выпуском продукции – 50млн.руб, и предприятие №12 со среднегодовой стоимостью производственных фондов –50 млн.руб. и выпуском продукции – 150млн.руб
2. Рассчитанные выборочные показатели представлены в таблицах 3 5. Сформируем на основе этих таблиц единую таблицу значений выборочных совокупностей:


Таблица 8

Описательные статистики выборочной совокупности

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"

Средняя арифметическая
130
Средняя арифметическая
130.4333333

Мода
135
Мода
130

Медиана
131.5
Медиана
129.5

Размах вариации
100
Размах вариации
120

Дисперсия
565.5333333
Дисперсия
804.7788889

Среднее линейное отклонение
19.13333333
Среднее линейное отклонение
21.85333333

Среднее квадратическое отклонение
23.78094475
Среднее квадратическое отклонение
28.36862508

Коэффициент вариации
18.29303443
Коэффициент вариации
21.74952089

Структурный коэффициент асимметрии К.Пирсона
-0.21025237
Структурный коэффициент асимметрии К.Пирсона
0.015275091


3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценим:
а) степень колеблемости значений признаков в совокупности;
Для этого необходимо оценить коэффициентом вариации V(
Принята следующая оценочная шкала колеблемости признака:
0%<V(40% - колеблемость незначительная;
40%< V(60% - колеблемость средняя (умеренная); (6)
V(>60% - колеблемость значительная.
Вывод: В данной задаче:
V(1=18,29%<40% - колеблемость незначительная;
V(2=21,75%<40% - колеблемость незначительная.
б) степень однородности совокупности по изучаемым признакам. Для нормальных и близких к нормальному распределений показатель V( служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства
V(33% (7)
совокупность является количественно однородной по данному признаку.
Вывод: Изучаемая совокупность является качественно однородной по обоим признакам, так как для них выполняется условие V(33% (для первого признака V( =8,2930, дл второго V( =21,7495)
в) устойчивость индивидуальных значений признаков;
Устойчивость индивидуальных значений признаков оценим на основе сопоставления средних отклонений – квадратического и линейного . В условиях распределений, близких к нормальному, между показателями и имеет место равенство: поэтому отношение показателей и может служить индикатором устойчивости данных.
По первому признаку:
По второму признаку: 
Вывод: Поскольку индикатор устойчивости данных для признака «среднегодовая стоимостью производственных фондов» больше 0,8, то делаем вывод, что значение данного признака неустойчивы, в них имеются «аномальные» выбросы. Поэтому, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдений, некоторые аномалии в первичных данных продолжают сохраняться. По второму признаку делаем вывод об устойчивости значений признака.
г) количество попаданий индивидуальных значений признаков в диапазоны (), (), (). Сформируем следующую таблицу:
Таблица 9
Распределение значений признака по диапазонам рассеяния признака относительно
Границы диапазонов
Количество значений xi, находящихся в каждой зане


1 признак
2 признак
1 признак
2 признак

()
106,22153,78
102,06159,28
20
19

()
82,44177,56
73,69187,17
28
28

()
58,66201,34
45,32215,54
30
30


Сопоставление полученных процентных соотношений рассеяния значений признаков по диапазонам с ожидаемым по правилу «трех сигм» показывает, что в первый диапазон попадает меньше значений. Соответственно по первому признаку – 66,7%, по второму – еще меньше 63,3% против ожидаемых 68,3%. Во второй диапазон по обоим признакам попадает по 93,3% значений, что также меньше вероятностной оценки - 95,4%. В третьем диапазоне появляются все значения по обоим признакам (ожидаемое – 99,7%).
Вывод: распределение данных по диапазонам близко к нормальному.
Дадим сравнительную характеристику распределений единиц совокупности