EMBED MSPhotoEd.3
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности
в среде MS Excel»
Вариант № 1


Выполнил: ст. III курса гр. 1
Козленко Т.В
Проверил: Яценко Г.Н


Курск , 2006 г.

Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35.
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (EMBED Equation.3), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(?²n), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asn).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ).
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

Статистический анализ генеральной совокупности
Рассчитать генеральную дисперсию EMBED Equation.3 , генеральное среднее квадратическое отклонение EMBED Equation.3 и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии Asn и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.




Априорный статистический анализ данных.
Таблица 1
EMBED Excel.Chart.8 \s
EMBED Excel.Chart.8 \s


Анализ выборочной совокупности.
В результате проведенного исследования и данных таблицы 3 выявлено две аномальных единицы наблюдения.
С учетом данных таблиц 3 и 5 сформируем единую таблицу значений выборочных показателей табл. 8

«Описательные статистики выборочной совокупности.»
Таблица 8
3.а) Т.к. степень колеблемости признака определяется по значению коэффициента вариации V? , то исходя из оценочной шкалы V? > 60% мы можем сделать вывод, что колеблемость значений признаков в совокупности значительная, т.к. и по первому, и по второму признакам мы имеем 538,51 >60%.
б) Т.К. 538,51 > 33%, то совокупность является количественно не однородной по данному признаку.
в) Сопоставление средних отклонений - квадратического ? и линейного d позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.
Имеют место равенства : ? = 1,25d d = 0,8 ?.
? =1,25*28,7=35,875; ? = 1,25*32,78=40,975;
d = 0,8*35,875=28,7; d = 0,8*40,975=32,78.
Отношение показателей может служить индикатором устойчивости данных :
d/? =28,7/35,875=0,8 – для первого признака
d/? =32,78/40,975=0,8 - для второго признака.
Т.к. соотношения равны 0,8, то значения признаков устойчивы, в них не имеются « аномальные выбросы».

г)Для нахождения количества попаданий индивидуальных значений признаков в диапазоны ( х±? ),(х±2?),(х±3?) составим таблицу 9.
Распределение значений признака по диапазонам рассеяния признака относительно х.
Таблица 9
Из таблицы видно, что количество значений хi находящихся в данных диапазонах одинаково по обоим признакам и процентное соотношение равно: для (х±?n) – 71%, (х±2?n) – 143%, (х±3?) – 214 %.
4.а) Т.к. коэффициент вариации V? показывает интенсивность колеблемости признака, то на основе таблицы 5 сделаем вывод, что V? обоих признаков имеет одинаковое значение V?=538,516, следовательно V?>60%, следовательно колеблемость признака значительная.
б) Показатель V? служит индикатором совокупности, следовательно при выполнении условия V?<33% совокупность является количественно однородной , в нашем случае совокупность является не однородной .т.к. V?=538,513 >33%.
в) Так как оценка V? достаточно высока ,т.е. V?>40% (V?=538,513), то наблюдается значительное расхождение между значениями хi , т.е. средняя х ненадежная характеристика совокупности и ее практическое применение становится проблематичным.
г) Коэффициент К.Пирсона для признака «Среднегодовая стоимость основных произ-ных фондов» ASn = -0,831,т.е. ASn <0, следовательно, здесь присутствует левосторонняя ассиметрия. Для признака «Выпуск продукции»
ASn = -0,831 , т.е. ASn <0,следовательно ассиметрия – левосторонняя.
д) Значение моды М0 полученного интервального ряда данных находится дальше от значения средней арифметической , чем значение моды не сгруппированного ряда (207,5-200=7,5 ; 195-200=5).Это говорит о том , что кривая распределения полученного интервального ряда данных менее симметрична относительно оси симметрии , чем кривая распределения не сгруппированного ряда.
Анализ генеральной совокупности.
На основе таблицы 3 сформируем отдельную таблицу для генеральных показателей ?²N, ?N, As, Eк .
« Описательная статистика генеральной совокупности »
Таблица 10.
Установим степень расхождения между ?²N и ?²n по формуле :
?²N = n/n-1 * ?²n
?²N =30/30-1*1272,45=1316,328 ?²N =30-30-1*1810,75=1873,792.
Рассчитаем прогнозные оценки вариации RN по следующей формуле:
RN =6?.
RN =6*36,28=217,68
RN =6*43,28=259,68
Сравнивая прогнозные значения с Rn =150 , получим 150 < 217,68;
180 <259,68 , т.е. RN > Rn.
По двум признакам прогнозная оценка размаха вариации в генеральной совокупности больше, чем в выборочной.
а) Средняя ошибка выборки µx рассчитана в таблице 3:
Для признака «Среднегодовая стоимость основных производственных фондов» µx = 6,624;
Для признака « Выпуск продукции» µx = 7,902.
б)Оценки предельных ошибок выборки имеются в таблицах 3,4а, 4б.На основе этих оценок и следующей формулы х-?x? x ?x+?x сформируем следующую таблицу 11.
«Предельные ошибки выборки и ожидаемые границы для генеральных средних»
Таблица 11
Для первого признака 200-6,745?х?200+6,745
193,255?х ? 206,745 и так далее.
Коэффициенты ассиметрии Аs и процесса Ек имеются в таблице 10:

Аs = - 0,153 Аs = 0,043
Ек = -0,345 Ек =-0,205
Т.к -0,153<0,25; 0,043<0,25,то ассиметрия распределения незначительная.
Т.к. -0,345<0 и -0,205<0, то это говорит о том, что вершина кривой распределения лежит ниже вершины нормальной кривой, в форма кривой более пологая по сравнению с нормальной. Это значит, что прямые формируются в центральной части и достаточно равномерно располагаются по всему диапазону от хмах до хмин..