ПРИЛОЖЕНИЕ 1
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности
в среде MS Excel»
Вариант № 1010
Выполнил: ст. III курса

Проверил:
Калуга
2006
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Выборочные данные приведены в табл. 1.
Таблица 1
Исходные данные
Номер предприятия
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.

1
54638,00
52118,00

2
64252,00
57178,00

3
66276,00
63756,00

4
69818,00
70840,00

5
45530,00
35420,00

6
73360,00
60720,00

7
75384,00
81972,00

8
56662,00
55660,00

9
69312,00
65274,00

10
79938,00
81466,00

11
87528,00
86020,00

13
66782,00
67804,00

14
73360,00
73876,00

15
83986,00
89562,00

16
96130,00
96140,00

17
71842,00
64768,00

18
79432,00
76912,00

19
63240,00
48070,00

20
80444,00
65780,00

21
89552,00
88550,00

22
61722,00
50094,00

23
49072,00
47058,00

24
81962,00
75394,00

25
73360,00
65780,00

26
68300,00
62238,00

27
53120,00
40480,00

28
71336,00
63250,00

29
82468,00
69322,00

30
78420,00
65780,00

32
57674,00
58696,00


В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения – линейное () и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности
Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Задание 1
Этап 1. Выявление и удаление из выборки аномальных единиц наблюдения
Первичные данные выборочной совокупности могут содержать аномальные значения изучаемых признаков. Задание 1 заключается в их выявлении и исключении из дальнейшего рассмотрения с целью обеспечения устойчивости данных статистического анализа.
Для выявления аномальных значений этих признаков построим график, используя диаграмму рассеяния.
Диаграмма рассеяния – это точечный график, осями Х и Y которого сопоставлены два изучаемых признака единиц совокупности.
Выделяем мышью оба столбца исходных данных в диапазоне В4:С35.
Вставка Диаграмма Точечная Готово.
В результате выполнения этих действий на рабочем листе Excel появляется диаграмма рассеяния (рис.1).

Рис. 2. Аномальные значения признаков на диаграмме рассеяния
Этап 2. Визуальный анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков, их удаление из первичных данных
Обнаружение резко выделяющихся наблюдений производится визуально, путем выявления точек, отстоящих от основной массы точек на существенном расстоянии.
Найти на графике точку, соответствующую аномальному наблюдению.
Подвести курсор к точке на диаграмме рассеяния, соответствующей аномальному наблюдению. После непродолжительного времени возле точки автоматически появится надпись, содержащая значения признаков этого наблюдения в формате (Х, Y) (рис. 2).

Рис. 2.
В полученном графике можно наблюдать две аномальные точки с координатами (96130;25300) и (30350;75900).
В исходных данных визуально находим в таблице 12 строку, соответствующую выявленной аномальной единице наблюдения (предприятию). Скопируем эту строку в таблицу 2.
Таблица 2
Аномальные единицы наблюдения

Выделяем мышью всю адресную строку с данными, подлежащими удалению.
Правка Удалить.
Выполняем действия с 1 по 5 до полного удаления всех аномальных наблюдений (рис. 3).
Перемещаем диаграмму рассеяния в область ячеек, начиная с ячейки F4.
Рис. 3. Диаграмма рассеяния после удаления аномальных значений
Задание 2
Этап 1. Расчёт описательных параметров выборочной и генеральной совокупности с использованием инструмента ОПИСАТЕЛЬНАЯ СТАТИСТИКА.
Алгоритм 1.1 Расчёт описательных статистик
Сервис Анализ данных Описательная статистика ОК;
Входной интервал диапазон ячеек таблицы, выделенный согласно (В4:С33) для значений признаков Стоимость основных фондов и Выпуск продукции
Группирование по столбцам;
Итоговая статистика - Активизировать;
Уровень надёжности - Активизировать;
Уровень надёжности 95,4
Выходной интервал адрес ячейки заголовка первого столбца (А46:С46) (рис. 4).
ОК;
При появлении окна с сообщением «Выходной интервал накладывается на имеющиеся данные» ОК.
В результате указанных действий Excel осуществляет вывод описательных статистик в заданный диапазон рабочего файла (табл. 3).

Рис.4. Диалоговое окно инструмента ОПИСАТЕЛЬНАЯ СТАТИСТИКА
Таблица 4
Описательные статистики

Этап 2. Оценка предельных ошибок выборки для различных уровней надёжности в режиме ОПИСАТЕЛЬНАЯ СТАТИСТИКА
Алгоритм 2.1. Расчёт предельной ошибки выборки при Р = 0,683
Сервис Анализ данных Описательная статистика ОК;
Входной интервал – диапазон ячеек таблицы, выделенный согласно (В4:С33) для значений признаков Стоимость основных фондов и Выпуск продукции;
Итоговая статистика – Снять флажок;
Уровень надёжности – Активизировать;
Уровень надёжности – 68,3;
Выходной интервал адрес ячейки, выделенный согласно (А67:С67) для предельной ошибки выборки при Р = 0,683;
ОК;
При появлении окна с сообщением «Выходной интервал накладывается на имеющиеся данные» ОК.
Алгоритм 2.1. Расчёт предельной ошибки выборки при Р = 0,997
Сервис Анализ данных Описательная статистика ОК;
Входной интервал – диапазон ячеек таблицы, выделенный согласно (В4:С33) для значений