EMBED MSPhotoEd.3
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности
в среде MS Excel»
Вариант №_11


Выполнил: ст. III курса гр._ ______
Ф.и.о.
Проверил:__Кандидат _
Технических наук, доцент
Голикова А.В

Москва, 2005 г.
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (EMBED Equation.3), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( EMBED Equation.3 ), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ).
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности.
Рассчитать генеральную дисперсию EMBED Equation.3 , генеральное среднее квадратическое отклонение EMBED Equation.3 и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Статистический анализ выборочной совокупности.
1. Для выявления среди исходных данных резко выделяющихся значений признаков («выбросов» данных») необходимо построить диаграмму рассеяния или ее еще называют точечный график ( рис.1 ). Согласно нашим исходным данным и соответствующей диаграмме таких значений два.
Эти значения представлены в таблице № 2.
2. Обобщающие статистические показатели совокупности по изучаемым признакам, которые необходимо рассчитать по условию, можно найти по следующим формулам:

EMBED Equation.3
Вычисленные обобщающие показатели совокупности, представленные в таблицах 3 и 5, сформируем в единую таблицу значений выборочных показателей по изучаемым признакам, перечисленных в условии задачи (таблица 8).
Распределения единиц по обоим признакам близки к нормальному:
а) Для оценки степени колеблемости значений признаков в совокупности используют коэффициент вариации.
Коэффициент вариации EMBED Equation.3 оценивает интенсивность колебаний вариантов относительно их средней величины.
Принята следующая шкала колеблемости признака:
EMBED Equation.3 - колеблемость незначительная;
EMBED Equation.3 - колеблемость средняя (умеренная);
EMBED Equation.3 - колеблемость значительная.
Согласно данной шкале колеблемость вариантов обоих признаков относительно их средних величин – незначительная.
б) Для оценки степени однородности совокупности по изучаемым признакам также используется коэффициент вариации.
Принято считать, что при выполнимости неравенства:
EMBED Equation.3
совокупность является количественно однородной по данному признаку.
Так как наши коэффициенты вариации соответствуют этому неравенству, совокупности по обоим признакам являются однородными.
в) Об устойчивости индивидуальных значений признака, то есть об отсутствии среди них аномальных вариантов значений, позволяет сделать вывод сопоставление средних отклонений – квадратического ? и линейного EMBED Equation.3 .
Если EMBED Equation.3 (индикатор устойчивости данных) > 0,8, то значения признака неустойчивы, в них имеются аномальные выбросы.
Первый признак Второй признак
0,804565737 0,770334596
Значения первого признака неустойчивы и у него есть аномальные единицы наблюдения (Таблица 2), значения второго признака устойчивы.
г) Количество попаданий индивидуальных значений признаков в диапазон, указанный в условии задачи, представлено в таблице 9.
Процентное соотношение рассеяния значений признака по трем диапазонам, представленным в таблице 9:
Первый признак Второй признак
EMBED Equation.3 - 20/32*100 = 62,5% 20/32*100 = 62,5%
EMBED Equation.3 - 28/32*100 = 87,5% 29/32*100 = 90,625%
EMBED Equation.3 - 31/32*100 = 96,875% 32/32*100 = 100%
Ожидаемые вероятностные оценки диапазонов рассеяния значений признака таковы:
EMBED Equation.3 - 68,3%
EMBED Equation.3 - 95,4%
EMBED Equation.3 - 99,7%
Дадим сравнительную характеристику распределений единиц совокупности по изучаемым признакам:
а) на основе анализа вариации признака: проверим следующие соотношения:
R = 6*?
?????.25* EMBED Equation.3
EMBED Equation.3 = Me = Mo
Asп = 0
Первый признак Второй признак
650= 927,46 780 = 1106,38
154,58 =155,46 184,40 = 177,56
900 = 909,75 =932,5 847,82 = 841,75 =845
Asп = -0,210 Asп = 0,015
Так как данные равенства нарушены, то в распределении существует асимметрия: для первого признака – левосторонняя асимметрия ( EMBED Equation.3 <Me<Mo), а для второго – правосторонняя ( EMBED Equation.3 >Mo>Me).
б) на основе анализа количественной однородности единиц: на основе коэффициента вариации:
Первый признак Второй признак
V? = 17, 17% V? = 21, 75%
Так как Vs EMBED Equation.3 33% для обоих признаков, то совокупность является количественно однородной по данным признакам, а единицы наблюдения количественно однородны.
в) на основе анализа надежности (типичности) средних значений признаков:
Так как V? EMBED Equation.3 33% для обоих признаков, то их средние арифметические являются надежной характеристикой данной совокупности.
г) на основе анализа симметричности распределений в центральной части ряда: на основе коэффициента Пирсона.
Так как EMBED Equation.3 для обоих признаков (таблица 8), то асимметрия в центральной части ряда незначительная.
Интервальный вариационный ряд распределения единиц совокупности по признаку «Среднегодовая стоимость основных производственных фондов» представлен в таблице 7.
Гистограмма распределения единиц совокупности по тому же признаку представлена на рисунке 2.
Так как наша гистограмма имеет одновершинную форму, есть основание предполагать, что выборка является однородной по данному признаку.
Для полученного интервального ряда значение моды Мо рассчитывается по формуле:
EMBED Equation.3
Где EMBED Equation.3 - нижняя граница модального интервала; h – величина модального интервала; EMBED Equation.3 - частота модального интервала; EMBED Equation.3 - частота интервала, предшествующего модальному;
EMBED Equation.3 - частота интервала, следующего за модальным.

Мо = 835 + 130* (11 – 5)/((11 – 5)+(11 – 7)) = 913
Мода же не сгруппированного ряда данных равна 932,5 (таблица 3). Это различие связано с тем, что, в одном случае, берется для анализа весь интервал, а, в другом случае, лишь его среднее (серединное) значение.


Статистический анализ генеральной совокупности
Величины генеральной дисперсии EMBED Equation.3 и генерального среднего квадратического отклонения EMBED Equation.3 представлены в таблице 10.
Установить степень расхождения EMBED Equation.3 и EMBED Equation.3 (таблица 8) можно по формуле:
EMBED Equation.3
Первый признак Второй признак
24717,71 = (32/31)*23893,78 35174,39= (32/31)*34001,91
24717,71 EMBED Equation.3 24664,55 35174,39 EMBED Equation.3 35098,74
Так как расхождение незначительное, то выборка является репрезентативной.
Прогнозные оценки размаха вариации RN рассчитываются по формуле:
RN = 6?
Первый признак Второй признак
RN = 943,31 RN = 1125,29
Сравним RN и Rn (таблица 8):
Rn < RN
a) Средние ошибки выборки рассчитаны и приведены в таблице 3.
б) Предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности представлены в таблице 11.
Значения коэффициентов асимметрии и эксцесса представлены в таблице 10.
Так как распределение единиц выборочной совокупности близко к нормальному, выборка является репрезентативной и при этом коэффициенты AsN и EkN указывают на незначительную величину асимметрии и эксцесса соответственно, то мы имеем основание полагать, что распределения единиц генеральной совокупности по изучаемым признакам будут близки к нормальным.





Приложение
EMBED Excel.Chart.8 \s

EMBED Excel.Chart.8 \s









Таблица 8
Описательные статистики выборочной совокупности


Описание генеральной совокупности.
Таблица 10