ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ КАФЕДРА СТАТИСТИКИ О Т Ч Е Т о результатах выполнения компьютерной лабораторной работы №1 Автоматизированный априорный анализ статистической совокупности в среде MS Excel Вариант № 32 Выполнила: ФИО Проверил: Пуляшкин Владимир Васильевич ФИО Москва, 2007 г.
Постановка задачи При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные о среднегодовой стоимости основных производственных фондов и выпуске продукции за год по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая). В статистическом исследовании эти предприятия выступают как единицы выборочной совокупности. Генеральную совокупность образуют все предприятия корпорации. Анализируемые признаки предприятий – Среднегодовая стоимость основных производственных фондов и Выпуск продукции – изучаемые признаки единиц совокупности. Для автоматизации статистических расчетов используются средства электронных таблиц процессора Excel. Выборочные данные представлены в диапазоне ячеек B4:C35 рабочего листа 1 (табл.1): Исходные данные Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
1 2786,00 4839,00
2 3109,00 5169,00
3 3177,00 5598,00
4 3296,00 6060,00
5 2480,00 3750,00
6 3415,00 5400,00
7 3483,00 6786,00
8 2854,00 5070,00
9 3279,00 5697,00
10 3636,00 6753,00
12 3891,00 7050,00
13 3194,00 5862,00
14 3415,00 6258,00
15 3772,00 7281,00
16 4180,00 7710,00
17 3364,00 5664,00
18 3619,00 6456,00
19 3075,00 4575,00
20 3653,00 5730,00
21 3959,00 7215,00
22 3024,00 4707,00
23 2599,00 4509,00
24 3704,00 6357,00
25 3415,00 5730,00
26 3245,00 5499,00
27 2735,00 4080,00
28 3347,00 5565,00
29 3721,00 5961,00
31 3585,00 5730,00
32 2888,00 5268,00
В процессе исследования совокупности необходимо решить ряд задач. I. Статистический анализ выборочной совокупности Выявить наличие среди исходных данных резко выделяющихся значений признаков (аномалий в данных) и исключить их из выборки. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию (), средние отклонения – линейное () и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп). На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить: а) степень колеблемости значений признаков в совокупности; б) степень однородности совокупности по изучаемым признакам; в) устойчивость индивидуальных значений признаков; г) количество попаданий индивидуальных значений признаков в диапазоны (), (), (). Сравнить распределения единиц совокупности по двум изучаемым признакам на основе анализа: а) колеблемости признаков; б) однородности единиц; в) надежности (типичности) средних значений признаков; г) симметричности распределений в центральной части ряда. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. II. Статистический анализ генеральной совокупности Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения генеральной и выборочной дисперсий. Для изучаемых признаков рассчитать: а) среднюю ошибку выборки; б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака в генеральной совокупности при заданных уровнях надежности. Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок охарактеризовать особенности формы распределения единиц генеральной совокупности по каждому из изучаемых признаков. 2. Выводы по результатам выполнения лабораторной работы I. Статистический анализ выборочной совокупности Задача 1. Количество аномальных единиц наблюдения (табл.2) равно двум, номера предприятий 11 и 30. Задача 2. Рассчитанные выборочные показатели представлены в двух таблицах — табл.3 и табл.5. На основе этих таблиц формируется единая таблица (табл.8) значений выборочных показателей, перечисленных в условии Задачи 2. Таблица 8 Описательные статистики выборочной совокупности Обобщающие статистические показатели совокупности по изучаемым признакам Признаки
Среднегодовая стоимость основных производственных фондов, млн. руб. Выпуск продукции, млн. руб.
Задача 3. 3а). Степень колеблемости признака определяется по значению коэффициента вариации V( в соответствии с оценочной шкалой колеблемости признака: 0%<V(40% - колеблемость незначительная; 40%< V(60% - колеблемость средняя (умеренная); V(>60% - колеблемость значительная. Вывод: Для признака Среднегодовая стоимость основных производственных фондов показатель V( =12,14. Так как значение показателя лежит в диапазоне 0%<V(40% оценочной шкалы, следовательно, колеблемость незначительная. Для признака Выпуск продукции показатель V( =16,30. Так как значение показателя лежит в диапазоне 0%<V(40% оценочной шкалы, следовательно, колеблемость незначительная. 3б). Степень однородности совокупности по изучаемому признаку для нормального и близких к нормальному распределений устанавливается по значению коэффициента вариации V(. Если V(33%, то по данному признаку расхождения между значениями признака невелико, единицы наблюдения количественно однородны. Вывод: Для признака Среднегодовая стоимость основных производственных фондов показатель V(33%, следовательно, по данному признаку выборочная совокупность количественно однородна . Для признака Выпуск продукции показатель V(33%, следовательно, по данному признаку выборочная совокупность количественно однородна. 3в). Сопоставление средних отклонений – квадратического ( и линейного –позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений. В условиях симметричного и нормального, а также близких к ним распределений между показателями ( и имеют место равенства (1,25, 0,8(, поэтому отношение показателей и ( может служить индикатором устойчивости данных. Если >0,8, то значения признака неустойчивы, в них имеются «аномальные» выбросы. Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдения при выполнении Задания 1, некоторые аномалии в первичных данных продолжают сохраняться. В этом случае их следует выявить (например, путем поиска значений, выходящих за границы диапазона (), приведенного в табл. 9) и рассматривать в качестве возможных «кандидатов» на исключение из выборки. Вывод: Для признака Среднегодовая стоимость основных производственных фондов показатель =0,800,8. Следовательно, значения признака устойчивы, среди них отсутствуют «аномальные» варианты значений. «Кандидаты» на исключение из выборки: нет Для признака Выпуск продукции показатель = 0,770,8. Следовательно, значения признака устойчивы, среди них отсутствуют «аномальные» варианты значений. «Кандидаты» на исключение из выборки: нет 3г). Для оценки количества попаданий индивидуальных значений признаков xi в тот или иной диапазон отклонения от средней , а также для выявления структуры рассеяния значений xi по 3-м диапазонам формируется табл.9 (с конкретными числовыми значениями границ диапазонов). Таблица 9 Распределение значений признака по диапазонам рассеяния признака относительно Границы диапазонов, млн. руб. Количество значений xi, находящихся в диапазоне Процентное соотношение рассеяния значений xi по диапазонам, %
Первый признак Второй признак Первый признак Второй признак Первый признак Второй признак