ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ КАФЕДРА СТАТИСТИКИ О Т Ч Е Т о результатах выполнения компьютерной лабораторной работы №1 «Автоматизированный априорный анализ статистической совокупности в среде MS Excel» Вариант №_1__ Выполнил: ст. III курса Специальность № ЛИЧНОГО ДЕЛА Проверил:________ ___________ Должность Ф.И.О. Брянск, 2008 г. Постановка задачи При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год. В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц. Таблица 1 Исходные данные A B C
3 Номер единицы наблюдения Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
4 1 98.00 103.00
5 2 117.00 113.00
6 3 121.00 126.00
7 4 128.00 140.00
8 5 80.00 70.00
9 6 135.00 120.00
10 7 139.00 162.00
11 8 102.00 110.00
12 9 127.00 129.00
13 10 148.00 161.00
14 11 163.00 170.00
15 12 122.00 134.00
16 13 135.00 146.00
17 14 156.00 177.00
18 15 180.00 190.00
19 16 132.00 128.00
20 17 147.00 152.00
21 18 115.00 95.00
22 19 149.00 130.00
23 20 167.00 175.00
24 21 112.00 99.00
25 22 87.00 93.00
26 23 152.00 149.00
27 24 135.00 130.00
28 25 125.00 123.00
29 26 95.00 80.00
30 27 131.00 125.00
31 28 153.00 137.00
32 29 145.00 130.00
33 30 104.00 116.00
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей. Статистический анализ выборочной совокупности Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения – линейное () и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп). На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить: а) степень колеблемости значений признаков в совокупности; б) степень однородности совокупности по изучаемым признакам; в) устойчивость индивидуальных значений признаков; г) количество попаданий индивидуальных значений признаков в диапазоны (), (), (). Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа: а) вариации признаков; б) количественной однородности единиц; в) надежности (типичности) средних значений признаков; г) симметричности распределений в центральной части ряда. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных. Статистический анализ генеральной совокупности Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий. Для изучаемых признаков рассчитать: а) среднюю ошибку выборки; б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности. Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению. Статистический анализ выборочной совокупности 1. Количество аномальных единиц наблюдения – 2, согласно табл.2: предприятие №31 со среднегодовой стоимостью производственных фондов – 180 млн.руб. и выпуском продукции – 50млн.руб, и предприятие №12 со среднегодовой стоимостью производственных фондов –50 млн.руб. и выпуском продукции – 150млн.руб 2. Рассчитанные выборочные показатели представлены в таблицах 3 5. Сформируем на основе этих таблиц единую таблицу значений выборочных совокупностей:
Таблица 8
Описательные статистики выборочной совокупности
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." По столбцу "Выпуск продукции, млн.руб"
Средняя арифметическая 130 Средняя арифметическая 130.4333333
3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценим: а) степень колеблемости значений признаков в совокупности; Для этого необходимо оценить коэффициентом вариации V( Принята следующая оценочная шкала колеблемости признака: 0%<V(40% - колеблемость незначительная; 40%< V(60% - колеблемость средняя (умеренная); (6) V(>60% - колеблемость значительная. Вывод: В данной задаче: V(1=18,29%<40% - колеблемость незначительная; V(2=21,75%<40% - колеблемость незначительная. б) степень однородности совокупности по изучаемым признакам. Для нормальных и близких к нормальному распределений показатель V( служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства V(33% (7) совокупность является количественно однородной по данному признаку. Вывод: Изучаемая совокупность является качественно однородной по обоим признакам, так как для них выполняется условие V(33% (для первого признака V( =8,2930, дл второго V( =21,7495) в) устойчивость индивидуальных значений признаков; Устойчивость индивидуальных значений признаков оценим на основе сопоставления средних отклонений – квадратического и линейного . В условиях распределений, близких к нормальному, между показателями и имеет место равенство: поэтому отношение показателей и может служить индикатором устойчивости данных. По первому признаку: По второму признаку: Вывод: Поскольку индикатор устойчивости данных для признака «среднегодовая стоимостью производственных фондов» больше 0,8, то делаем вывод, что значение данного признака неустойчивы, в них имеются «аномальные» выбросы. Поэтому, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдений, некоторые аномалии в первичных данных продолжают сохраняться. По второму признаку делаем вывод об устойчивости значений признака. г) количество попаданий индивидуальных значений признаков в диапазоны (), (), (). Сформируем следующую таблицу: Таблица 9 Распределение значений признака по диапазонам рассеяния признака относительно Границы диапазонов Количество значений xi, находящихся в каждой зане
1 признак 2 признак 1 признак 2 признак
() 106,22153,78 102,06159,28 20 19
() 82,44177,56 73,69187,17 28 28
() 58,66201,34 45,32215,54 30 30
Сопоставление полученных процентных соотношений рассеяния значений признаков по диапазонам с ожидаемым по правилу «трех сигм» показывает, что в первый диапазон попадает меньше значений. Соответственно по первому признаку – 66,7%, по второму – еще меньше 63,3% против ожидаемых 68,3%. Во второй диапазон по обоим признакам попадает по 93,3% значений, что также меньше вероятностной оценки - 95,4%. В третьем диапазоне появляются все значения по обоим признакам (ожидаемое – 99,7%). Вывод: распределение данных по диапазонам близко к нормальному. Дадим сравнительную характеристику распределений единиц совокупности