EMBED MSPhotoEd.3
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности в среде MS Excel»
Вариант № 9



Выполнил:
Проверил:


Уфа - 2007г.
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Для варианта № 9 выборочные данные приведены в табл. 1-В9.
Таблица 1-В9
Исходные данные Варианта № 9

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (EMBED Equation.3), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( EMBED Equation.3 ), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ).
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности
Рассчитать генеральную дисперсию EMBED Equation.3 , генеральное среднее квадратическое отклонение EMBED Equation.3 и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.






СТАТИСТИЧЕСКИЙ АНАЛИЗ ВЫБОРОЧНОЙ И ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
Анализ выборочной совокупности
Задача 1. Выявим наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения, используя диаграмму рассеяния. Аномальных единиц наблюдения 2 – см. Табл.2 (ПРИЛОЖЕНИЕ 1)
Задача 2. Рассчитанные обобщающие статистические показатели совокупности по изучаемым признакам: средняя арифметическая (EMBED Equation.3), мода(Мо), медиана (Ме), дисперсия( EMBED Equation.3 ), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп) представлены в таблицах 3 и 5 (ПРИЛОЖЕНИЕ 2). На основе этих таблиц сформируем единую Таблицу 8 значений выборочных показателей «Описательные статистики выборочной совокупности»
Таблица 8
Табл. 8. Описательные статистики выборочной совокупности
Размах вариации R равен значению интервала.
Задача 3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценим:
а) степень колеблемости значений признаков в совокупности определим по значению коэффициента вариации V? , исходя из оценочной шкалы:
0% < V?? 40% - колеблемость незначительная;
40% < V? ? 60% - колеблемость средняя (умеренная);
V? > 60% - колеблемость значительная.
Так как V? =17,20989423 по столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." ; V? = 21,74952089 по столбцу "Выпуск продукции, млн.руб" и 0% < V? <(=) 40% , то колеблемость незначительная.
б) степень однородности совокупности по изучаемым признакам:
Для нормальных и близких к нормальному распределений показатель V? служит индикатором однородности совокупности: если V? ? 33%, то совокупность является однородной по данному признаку.
Значит, совокупность является однородной по Среднегодовой стоимости основных производственных фондов (V? =17,20989423) и по Выпуску продукции (V? = 21,74952089).
в) устойчивость индивидуальных значений признаков:
Определим отношение среднего линейного отклонения (EMBED Equation.3) к квадратическому (?n); если EMBED Equation.3 / ?n > 0,8, то значения признака неустойчивы, в них имеются «аномальные» выбросы.
по столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб.":
105,2333333 /133,0311734 = 0,79104266 (1)
Т.к. (1) <0,8, значит значения признака устойчивые.

2) по столбцу "Выпуск продукции, млн.руб":
120,1933333/158,6947668 =0,7573868 (2)
Т. к. (2) < 0,8, то значения признака устойчивые.
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ).
Таблица 9
Табл. 9. Распределение значений признака по диапазонам рассеяния признака относительно EMBED Equation.3
На основе данных таблицы 9 определим процентное соотношение рассеяния значений признака по трём диапазонам:
Всего 30 единиц наблюдения (предприятий) - 100%
20 – 66,67%
28 – 93,33%
Сопоставим полученное соотношение с ожидаемым по правилу «трёх сигм»:
Ожидаемое соотношение:
68,3% войдёт в диапазон ( EMBED Equation.3 )
95,4% попадёт в диапазон ( EMBED Equation.3 )
99,7% появится в диапазоне ( EMBED Equation.3 )
Полученное соотношение:
66,67% входит в диапазон ( EMBED Equation.3 )
93,33% попадает в диапазон ( EMBED Equation.3 )
100% появляется в диапазоне ( EMBED Equation.3 )
Задача 4. Дадим сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков:
V?(1) первого признака (17,20989423) < V?(2) второго признака (21,74952089)
б) количественной однородности единиц:
Для нормальных и близких к нормальному распределений показатель V? служит индикатором однородности совокупности: если V? ? 33%, то совокупность является однородной по данному признаку.
Значит, совокупность является однородной по двум признакам, но она более однородна по Среднегодовой стоимости основных производственных фондов (V?(1) =17,20989423%), чем по Выпуску продукции (V?(2) = 21,74952089%).
в) надежности (типичности) средних значений признаков:
Для оценки надёжности (типичности) средней величины EMBED Equation.3 воспользуемся значением показателя вариации. Т. к. его значение невелико (V? ?33%), то индивидуальные значения признака хi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно средняя величина EMBED Equation.3 является надёжной характеристикой данной совокупности. Для первого признака EMBED Equation.3 является наиболее надёжной (типичной), т.к. V?(1)< V?(2)
г) симметричности распределений в центральной части ряда:
В симметричном распределении характеристики центра распределения совпадают: EMBED Equation.3= Мо= Ме.
Так как для первого признака справедливо неравенство EMBED Equation.3< Ме < Мо, 760< 768,25<787,5, то для данного случая характерна левосторонняя асимметрия. Для второго признака EMBED Equation.3 > Мо > Ме, 717,3833333 > 715 > 712,25- правосторонняя асимметрия.
По оценочной шкале асимметричности:
|As| ? 0,25 – асимметрия незначительная;
0,25 < |As| ?0,5 – асимметрия заметная (умеренная);
|As| > 0,5 – асимметрия существенная.
В данном случае асимметрия незначительная по обоим признакам, т.к.
Asп(1) = - 0,21025237 для первого признака,
Asп(2)= 0,015275091 для второго признака
и |As| ? 0,25
| Asп(1) | > | Asп(2) | , поэтому распределение по первому признаку более асимметрично.
Задача 5. Построим интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установим характер (тип) этого распределения.
Табл. 7. Интервальный ряд распределения предприятий по стоимости основных производственных фондов
Гистограмма
EMBED Excel.Chart.8 \s
Для определения типа закономерности эмпирического распределения оно приближённо описывается теоретическим (вероятностным) распределением, форма кривой которого называется формой распределения. Расхождение между формой распределения и нормальной формой оценим показателями асимметрии и эксцесса.
Т. к. гистограмма имеет одновершинную форму, можно предполагать, что выборка является однородной по признаку Среднегодовая стоимость основных производственных фондов.
В симметричном распределении характеристики центра распределения
совпадают: EMBED Equation.3 = Мо= Ме;
As = 0, Asп = 0, R = 6 ? , где R - размах вариации
Данные соотношения нарушены, что свидетельствует о наличии асимметрии распределения. Вершина сдвинута вправо и левая часть длиннее правой, то в данном случае левосторонняя асимметрия, для которой справедливо неравенство EMBED Equation.3< Ме < Мо, 760< 768,25< 787,5; оно означает что в распределении чаще встречаются более низкие значения признака. Распределение с незначительной асимметрией (задача 4 п. г ) часто относят к нормальному.
Показатель эксцесса характеризует крутизну кривой распределения - её заострённость или пологость по сравнению с нормальной кривой.
Коэффициент эксцесса Еk = - 0,344943844, Еk < 0, это значит, что значения данного признака достаточно равномерно рассеяны по всему диапазону от xmax до xmin.
Т.о. гистограмма приблизительно симметрична, её «хвосты» не очень длинны, поэтому она представляет распределение, близкое к нормальному.
Рассчитаем моду Мо* полученного интервального ряда по формуле:
Mo* = XMo + h*[ (fMo – fMo-1) / (fM – fMo-1) + (fMo + fMo-1)],
где XMo – нижняя граница модального интервала,
h – величина модального интервала,
fMo – частота модального интервала
Mo* = 705 + 110 * [(11-5) / (11-5) + (11-7)] = 771
Сравним ее с показателем Мо несгруппированного ряда данных:
Mo = 787,5 ( из табл. 3 ПРИЛОЖЕНИЕ 2) Mo* =771; Mo* < Mo


Анализ генеральной совокупности
Задача 1. Значения генеральной дисперсии EMBED Equation.3 , генерального среднего квадратического отклонения EMBED Equation.3 , коэффициент асимметрии К.Пирсона (Asп), эксцесс Еk приведены в таблице 3. Сформируем для них таблицу 10 «Описательные статистики генеральной совокупности».
Таблица 10
Табл. 10. Описательные статистики генеральной совокупности
Установим степень расхождения между EMBED Equation.3 и EMBED Equation.3 по формуле:
EMBED Equation.3 = n/(n-1)* EMBED Equation.3
1)для первого признака: EMBED Equation.3 = 30 / (30 - 1) * 17107,38333=17697,2931,
EMBED Equation.3 и EMBED Equation.3 совпадают
2)для второго признака: EMBED Equation.3 = 30 / (30 - 1) * 24344,56139=25184,02902,
EMBED Equation.3 и EMBED Equation.3 отличаются незначительно.
Прогнозные оценки размаха вариации RN рассчитаем по формуле:
R = 6 ? и сравним для каждого признака прогнозное значение RN с Rn.
1)для первого признака: RN = 6 *133,0311734 = 798,1870404
Rn = 550, RN > Rn
2)для второго признака: RN = 6 *158,6947668 = 952,1686008
Rn = 660, RN > Rn
Задача 2. Для изучаемых признаков рассчитаем:
а) Средние ошибки выборки рассчитаны и приведены в таблице 3.
б) Оценки предельных ошибок выборки для уровней надежности P=0,683, P=0,954, P=0,997 имеются в табл. 3, табл. 4а, табл. 4б.
Найдём границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности Х = EMBED Equation.3 ? ?х.
Таблица 11
Табл. 11. Предельные ошибки выборки и ожидаемые границы для генеральных средних

Задача 3. Значения коэффициентов асимметрии As и эксцесса Ek приведены в таблице 10.
Так как распределение единиц выборочной совокупности близко к нормальному, выборка является репрезентативной (значения показателей EMBED Equation.3 и EMBED Equation.3 расходятся незначительно) и при этом коэффициенты
AsN (1) = - 0,152503649, AsN (2) = 0,042954448 указывают на небольшую величину асимметрии; EkN(1) = - 0,344943844, EkN(2) = - 0,205332365 указывают на умеренную величину эксцесса. На основе этого можно считать, что распределение единиц генеральной совокупности по изучаемым признакам будет близко к нормальному.





ПРИЛОЖЕНИЕ 1



ПРИЛОЖЕНИЕ 2
EMBED Excel.Chart.8 \s











ПРИЛОЖЕНИЕ 3