EMBED MSPhotoEd.3

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности в среде MS Excel»
Вариант №344

Выполнил: ст. III курса гр. день
Ф.И.О.
Проверил: Теймурова Т. Ю.
Ф.И.О.

Калуга -2007-
1. Постановка задачи.
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (EMBED Equation.3), моду (Мо), медиану (Ме), размах вариации (R), дисперсию ( EMBED Equation.3 ), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ).
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
4. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности. Рассчитать генеральную дисперсию EMBED Equation.3 , генеральное среднее квадратическое отклонение EMBED Equation.3 и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
2. Выполнение статистических расчетов.
Задание1
1. Построим точечную диаграмму рассеяния изучаемых признаков.
2. Найдем на диаграмме аномальные точки.

Рис.1
В нашем случаи это точки 12(10370,00; 25950,00) и 31 (32860,00; 8650,00)
Удаляем эти точки из таблицы исходных данных.
После исключения аномальных наблюдений первичные данные принимают вид, представленный в таблице 1а.
Таблица 1а
Задание2
1. Произведем расчет описательных параметров выборочной и генеральной совокупности с использованием инструмента описательная статистика.
Таблица 3
Чтобы определить значение признака, характерное для всей изучаемой совокупности единиц, прибегают к расчету средних величин. Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчете на единицу качественно однородной совокупности
Мода МО - значение случайной величины, встречающееся с наибольшейвероятностью, в дискретном вариационном ряду - вариант, имеющий наибольшую частоту.Моды вычисляется по формуле: EMBED Equation.3
Где Хмо - нижняя граница модального интервала; i мо - модальный интервал; fMO, fMo-1, fMo+1 - частоты в модальном, предыдущем и следующем за модальным интервалах (соответственно)
Медиана Me - это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные (по числу единиц) части - со значениями признака меньше медианы и со значениями признака больше медианы. Медиана определяется по формуле: EMBED Equation.3
Хме - нижняя граница медианного интервала; i ме - величина медианного интервала; f ме - частота медианного интервала; SMe-1 - накопленная частота интервала предшествующего медианному интервалу
2. Оценим предельные ошибки выборки для различных уровней надежности в режиме описательная статистика.
Для уровня надежности 68,3% при р=0,683
Таблица 4а
Для уровня надежности 99,7% при р=0,997
Таблица 4б
Предельные ошибки выборки ? позволяет определить предельные значения показателей генеральной совокупности и их доверительные интервалы. Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:
EMBED Equation.3
EMBED Equation.3
Произведем расчеты описательных параметров выборочной совокупности с использованием инструмента мастера функции.
3.1 Расчет выборочного стандартного отклонения ?n для признаков Среднегодовой стоимости основных производственных фондов и выпуска продукции;
3.2Расчет выборочной дисперсии EMBED Equation.3 по признакам Среднегодовой стоимости основных производственных фондов и Выпуска продукции;
3.3 Расчет выборочного среднего линейного отклонения EMBED Equation.3 по изучаемым признакам;
3.4 Расчет коэффициента вариации V? по изучаемым признакам;
3.5 Расчет выборочного коэффициента асимметрии Пирсона Asn по изучаемым признакам.
Таблица 5
Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:
EMBED Equation.3 Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности
Показатели асимметрии оценивают смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения. EMBED Equation.3

Задание3
1. Построение промежуточной таблицы.
Таблица 6
2. Генерация выходной таблицы и графиков.
3. Приведение выходной таблицы и диаграммы к виду, принятому в статистике.
Таблица 7

Рис.2 График – диаграмма распределение предприятий по стоимости основных производственных фондов и выпуску продукции.
Гистограмма – это столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда. На отрезках строят прямоугольники, высота которых в принятом масштабе по оси ординат соответствует частотам.
Заключение
В совокупности из 32 - х предприятий наблюдается взаимосвязь между стоимостью основных производственных фондов и объемом выпуска продукции. Однако предприятие № 12 и предприятие № 31 резко отличаются от общих тенденций. Так, например, предприятие № 12 имеет наименьшую стоимость основных средств и большой объем выпуска продукции. Следовательно, оно может специализироваться на другой отрасли, этот признак не специфичен. В предприятии № 31 наблюдается обратная ситуация, оно имеет большую стоимость основных средств и небольшой объем выпуска продукции. Следовательно, этот признак специфичен. Таким образом, мы выявили наличие среди исходных данных резко выделяющиеся значения признаков с целью исключения из выборки аномальных единиц наблюдения. Аномальные единицы наблюдения представлены в таблице 2.
Анализ средней показывает, что среднегодовая стоимость основных производственных фондов составляет 24210 млн. руб., а выпуск продукции 22564,96667 млн. руб.
Анализ моды показывает, что наиболее часто встречающийся показатель среднегодовой стоимости основных производственных фондов имеет значение 25075 млн. руб. По столбцу «Выпуск продукции» наиболее часто встречающимся показателем является значение 22490 млн. руб.
Анализ медианы показывает, что из 30 предприятий 15 имеют среднегодовую стоимость основных производственных фондов более 24469,5млн. руб., а другие 15 предприятий менее. Также значение медианы говорит о том, что из 30 предприятий 15 имеют выпуск продукции более 22403,5 млн. руб., а другие 15 предприятий менее.
Анализ предельных ошибок выборки определяет ожидаемые границы для средних. С вероятностью 0,683 можно утверждать, что среднегодовая стоимость основных производственных фондов одного предприятия по всем предприятиям отрасли будет находиться в пределах от 20026,56 до 28394,44; с вероятностью 0,954 в пределах от 15841,12 до 32578,87; с вероятностью 0,997 от 11656,69 до 36763,31. Также можно утверждать, что с вероятностью 0,683 средний выпуск продукции одного предприятия по всем предприятиям отрасли будет находиться в пределах от 17573,29 до 27556,64; с вероятностью 0,954 в пределах от 12581,62 до 32548,31; с вероятностью 0,997 в пределах от 7589,95 до 37539,98.
Анализ коэффициента эксцесса (Еk) определяется следующими показателями:
Для первого признака коэффициент (Еk= -0,344943844) Еk?0, следовательно вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средним. Для второго признака (Еk= -0,205332365) Еk<0, следовательно вершина кривой распределения лежит выше вершины нормальной кривой, а форма кривой более островершинной по сравнению с нормальной.
Анализ коэффициентов вариации определяет, что степень колеблемости значений признаков в совокупности незначительная, поскольку полученные значения коэффициентов вариации для двух признаков располагаются в пределах 0%<V?<40% т.е. для первого признака коэффициент вариации равен 16,99379059% а для второго признака 21,74952089%. Совокупность по изучаемым признакам является количественно однородной, так как выполняется неравенство V?<33%, характерное для нормальных и близких к нормальному распределений. Поскольку значение показателя вариации для каждого признака невелико, то индивидуальные значения признака мало отличаются друг от друга, единицы наблюдения количественно однородны и следовательно, средняя арифметическая величина каждого признака является надежной характеристикой данной совокупности.
Анализ показателей асимметрии говорит о том, что поскольку EMBED Equation.3 < Me < Mo и Asn1 < 0 для первого признака характерна левосторонняя асимметрия (Asn1 = -0,152503649), а для второго признака характерна правостороння асимметрия, т.к. (Asn2 = 0,042954448) EMBED Equation.3 < Me < Mo и Asп2 > 0 . Так как для обоих признаков EMBED Equation.3 0,25, то асимметрия незначительная.
Рассматривая таблицу № 7 и график можно сделать вывод, что наибольшее число предприятий 18 или 60% имеют среднегодовую стоимость основных производственных фондов от 22480 до 24975. Наименьшее число предприятий 3 или 10% имеют среднегодовую стоимость основных производственных фондов от 24975 и выше.