Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.








Таблица 1
Исходные данные варианта
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (EMBED Equation.3), моду (Мо), медиану (Ме), размах вариации (R), дисперсию ( EMBED Equation.3 ), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ).
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности
Рассчитать генеральную дисперсию EMBED Equation.3 , генеральное среднее квадратическое отклонение EMBED Equation.3 и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Отчетность по работе:
Результативные таблицы:
Таблица 2
Аномальные единицы наблюдения


Таблица 3
Описательные статистики
Таблица 4а
Предельные ошибки выборки

Таблица 4б
Предельные ошибки выборки
Таблица 5
Выборочные показатели вариации и асимметрии
Таблица 6

Таблица 7
Интервальный ряд распределения предприятий
по стоимости основных производственных фондов
Рисунок 1
EMBED Excel.Chart.8 \s Анализ выборочной совокупности
1. Для выявления и исключения аномальных единиц наблюдения построена график-диаграмма (рис. 2) рассеяния изучаемых признаков. В результате визуального анализ диаграммы рассеяния признаков единиц наблюдаемой совокупности, выявлены две аномальные единицы наблюдения (таб.2). Приведенные в табл. 2 аномальные единицы наблюдения удалены из изучаемой совокупности с целью повышения степени ее однородности и статистической точности оценок расчетных показателей. Аномальные единицы наблюдения подлежат индивидуальному анализу с точки зрения «законности» причинах появления в совокупности.
Рисунок 2
EMBED Excel.Chart.8 \s
2. Рассчитанные выборочные показатели, представленные в двух таблицах (таблица 3 и таблица 5), формируем в единую таблицу значений выборочных показателей (таблица 8).
Таблица 8
Описательные статистики выборочной совокупности
3. На основе рассчитанных показателей (таблица 8) в предположении, что распределения единиц по обоим признакам близки к нормальному, сделаем ряд важных выводов:
а) Коэффициент вариации для признака «Среднегодовая стоимость ОПФ, млн. руб.» составляет 17,01716155%, для признака «Выпуск продукции, млн. руб.» 21,74952089%, что говорит о незначительной колеблемости характеризуемых признаков, т.к. выполняется условие 0%<V?<40%.
б) Совокупность по изучаемым признакам является количественно однородной, так как выполняется неравенство V?<33%, характерное для нормальных и близких к нормальному распределений. Поскольку значение показателя вариации для каждого признака невелико, то индивидуальные значения признака мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина каждого признака является надежной характеристикой данной совокупности.
в) Сопоставление средних отклонений – квадратического и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений. Для среднегодовой стоимости ОПФ EMBED Equation.3 . Для выпуска продукции EMBED Equation.3
Условие EMBED Equation.3 не выполняется, следовательно, для данных признаков можно сделать вывод о том, что значения устойчивы и не имеется более аномальных выбросов.
г) Для распределения значений признаков по диапазонам рассеяния признаков относительно средних значений признаков построим таблицу 9
Таблица 9
Распределение значений признака по диапазонам рассеяния признака относительно EMBED Equation.3
В нормальном распределении вероятностные оценки диапазонов рассеяния значений признака таковы:
68,3 % войдёт в диапазон ( EMBED Equation.3 )
95,4 % войдёт в диапазон ( EMBED Equation.3 )
99,7 % % войдёт в диапазон ( EMBED Equation.3 )
В нашем случае вероятностные оценки диапазонов для первого и второго признаков таковы:
63,3% ( EMBED Equation.3 )
93,3% ( EMBED Equation.3 )
100% ( EMBED Equation.3 )
Полученные значения процентного соотношения рассеяния для наших признаков близки к значениям процентного соотношения признаков, распределенных по нормальному закону, исходя из этого можно сделать вывод о том, что наше распределение близко к нормальному.
4. Используя данные из таблицы 8 необходимо сравнить величины показателей для двух признаков:
а) V?1 < V? 2 (V?1 = 17,01716155 V?2= 21,74952089 ) поэтому колеблемость единиц совокупности для первого признака меньше, чем для второго.
б) Количественная однородность единиц выше для первого признака по сравнению со вторым, исходя из значений показателя коэффициента вариации.
в) Коэффициент вариации для признака «Среднегодовая стоимость ОПФ, млн. руб.» составляет 17,01716155%, для признака «Выпуск продукции, млн. руб.» - 21,74952089%, это говорит о том, что варианты признака «Среднегодовая стоимость основных производственных фондов, млн. руб.» более однородны, чем варианты признака «Выпуск продукции, млн. руб.». Чем однороднее изучаемая совокупность, тем надежнее полученное среднее значение признака. Следовательно, среднее значение среднегодовой стоимости ОПФ более надежно, чем среднее значение выпуска продукции.
г) Поскольку EMBED Equation.3 < Me < Mo и Asп1 < 0 для первого признака характерна левосторонняя асимметрия (Asп1 = -0,21025237). Поскольку EMBED Equation.3 < Me < Mo и Asп2 > 0 для второго признака характерна правостороння асимметрия (Asп2 = 0,015275091). Так как для обоих признаков EMBED Equation.3 0,25, то асимметрия незначительная.
5. Гистограмма (рис.1) имеет ярко выраженную одновершинную форму, следовательно, выборка является однородной по данному признаку.
Коэффициент асимметрии для среднегодовой стоимости ОПФ
As=-0,15<0, в центральном диапазоне AsП=-0,21<0, следовательно, имеет место левосторонняя асимметрия. Коэффициент эксцесса для среднегодовой стоимости ОПФ Ек=-0,34<0, следовательно, распределение плосковершинное. Это означает что значения признака «Среднегодовая стоимость ОПФ, млн.руб.» не концентрируются в центральной части ряда, а рассеяны по всему диапазону от минимального значения до максимального значения, причем в распределении чаще всего встречаются более низкие значения признака.
Коэффициент асимметрии для выпуска продукции As=0,04>0, в центральном диапазоне AsП=0,02>0, следовательно, имеет место правосторонняя асимметрия. Коэффициент эксцесса выпуска продукции Ек=-0,21<0, следовательно, распределение плосковершинное. Это означает, что значения признака «Выпуск продукции, млн. руб.» не концентрируются в центральной части ряда, а рассеяны по всему диапазону от минимального значения до максимального значения, причем в распределении чаще всего встречаются более высокие значения признака.
Так как EMBED Equation.3 для среднегодовой стоимости ОПФ, то асимметрия для данного признака умеренная. Так как EMBED Equation.3 для выпуска продукции, то асимметрия для данного признака незначительная.
Делаем вывод, что, так как для признака “Среднегодовая стоимость ОПФ, млн.руб.” построенная гистограмма приблизительно симметрична, а ее “хвосты” не очень длинны и асимметрия для данного признака умеренная, она представляет собой распределение, близкое к нормальному. Для выпуска продукции асимметрия незначительна, поэтому данное распределение принимаем близким нормальному.
Рассчитаем значение моды для полученного интервального ряда.
EMBED Equation.3
EMBED Equation.3
Расхождение значений моды для дискретного и для интервального ряда 5717,5 (для дискретного) и 4023 (для интервального) говорит о том, что ряд ассиметричен.
Анализ генеральной совокупности
1. Рассчитанные показатели для анализа генеральной совокупности представлены в таб. 3. Для удобства и упрощения дальнейшего анализа полученных показателей сформируем таб. 10.
Таблица 10
Описательные статистики генеральной совокупности
Характеристика полученных показателей
Оценим дисперсию генеральной совокупности по выборочной дисперсии EMBED Equation.3
EMBED Equation.3 - для среднегодовой стоимости ОПФ
EMBED Equation.3 - для выпуска продукции
Исчисленные по формуле и средствами Excel дисперсии генеральной совокупности для изученных признаков соответственно совпадают.
EMBED Equation.3 и EMBED Equation.3 для среднегодовой стоимости ОПФ расходятся незначительно (ошибка репрезентативности 31475,8583 или 3,4%).
EMBED Equation.3 и EMBED Equation.3 для выпуска продукции расходятся незначительно (ошибка репрезентативности 44791,543 или 1,4%).
Прогнозную оценку размаха вариации рассчитаем по формуле для нормального распределения: EMBED Equation.3
EMBED Equation.3 - для среднегодовой стоимости ОПФ
EMBED Equation.3 - для выпуска продукции
Итак, размах вариации в генеральной совокупности для среднегодовой стоимости ОПФ на 5636,08-3950=1686,08 млн. руб. больше, чем в выборке; размах вариации в генеральной совокупности выпуска продукции на 6723,36-4740=1983,36 млн. руб. больше, чем в выборке по этому признаку. Т.е. ошибка репрезентативности для показателя размах вариации для признака «Среднегодовая стоимость ОПФ, млн. руб.» составляет 1686,08 млн. руб., для признака «Выпуск продукции, млн. руб.» 1983,36 млн. руб.
Задание 2:
а) По таб. 3 видно, что среднее квадратическое отклонение выборочной средней от математического ожидания генеральной средней (стандартная ошибка) по среднегодовой стоимости ОПФ составляет 174,4324178 млн. руб., по выпуску продукции – 208,0828964 млн. руб.
б) Для анализа ошибок выборки и вычисления ожидаемых границ для генеральных средних сформируем таблицу 11 на основе исчисленных данных предельных ошибок с заданными уровнями вероятностей, представленных в таб. 3, 4а и 4б.
Таблица 11
Предельные ошибки выборки и ожидаемые границы для генеральных средних
Для генеральной средней предельные значения и их доверительные интервалы определяются выражениями EMBED Equation.3 ; EMBED Equation.3 .
3. Т.к. выборка по обоим признакам является репрезентативной (значения показателей EMBED Equation.3 и EMBED Equation.3 расходятся незначительно), распределения единиц выборочных совокупностей близки к нормальному, коэффициенты АsN и EkN указывают на умеренную асимметрию для признака “Среднегодовая стоимость ОПФ, млн. руб.” и незначительную асимметрию для признака “Выпуск продукции, млн. руб.” (анализ этих показателей приведен выше), то можно сделать вывод, что распределение единиц генеральной совокупности по двум изученным признакам близко к нормальной форме.
Экономическое содержание задач статистического исследования
1. Образующие выборку предприятия типичны, исключения составляют 12-е и 31-е предприятия. Эти аномальные значения приведены в таб.2 – для предприятия № 12 среднегодовая стоимость ОПФ составляет 2360,00 млн. руб. при выпуске продукции в 5925,00 млн. руб., для предприятия № 31 среднегодовая стоимость ОПФ составляет 7495,00 млн. руб. при выпуске продукции 1975,00 млн. руб. Такие данные нетипичны для всей выборки в целом.
2. Наиболее характерные для предприятий значения среднегодовой стоимости ОПФ 5520 млн. руб. и выпуска продукции 5152,12 млн. руб.
Среднее квадратическое отклонение по среднегодовой стоимости ОПФ составляет 955,40 млн. руб., по выпуску продукции – 1139,71 млн. руб.
Предприятия с наиболее характерными значениями среднегодовой стоимости ОПФ, входящими в диапазон EMBED Equation.3 = EMBED Equation.3 или от 4564,6 до 6475,4 , представлены в таблице 12.
Таблица 12
Предприятия с наиболее характерными значениями среднегодовой стоимости ОПФ
Предприятия с наиболее характерными значениями выпуска продукции, входящими в диапазон EMBED Equation.3 или от 4012,41 до 6291,83, представлены в таблице 13.
Таблица 13
Предприятия с наиболее характерными значениями выпуска продукции
3. Коэффициент вариации среднегодовой стоимости ОПФ составляет 17,30%, для выпуска продукции - 22,12%, что говорит о незначительной колеблемости характеризуемых величин, т.к. выполняется условие EMBED Equation.3 . Так же этот показатель служит индикатором однородности изучаемой совокупности, т.к. выполняется условие EMBED Equation.3 , делаем вывод, что, изучаемая совокупность является однородной и по среднегодовой стоимости основных производственных фондов и по выпуску продукции. Причем варианты признака «Среднегодовая стоимость основных производственных фондов, млн. руб.» более однородны, чем варианты признака «Выпуск продукции, млн. руб.». Чем однороднее изучаемая совокупность, тем надежнее полученное среднее значение признака. Следовательно, среднее значение среднегодовой стоимости ОПФ более надежно, чем среднее значение выпуска продукции.
Размах вариации, то есть максимальное расхождение в значениях показателей, для среднегодовой стоимости ОПФ составляет 3950,00 млн. руб., для выпуска продукции - 4740,00 млн. руб. Это говорит о том, что среднегодовая стоимость ОПФ более устойчива, чем выпуск продукции. Максимальные расхождения в показателях предприятий выборочной совокупности относительно небольшие. Таким образом, выборка сформирована из предприятий с достаточно близкими значениями показателей по каждому признаку.
4. В таблице 7 «Интервальный ряд распределения предприятий по стоимости основных производственных фондов» приведена группировка по данному признаку. По таблице 7 построим таблицу 15 , в которой отразим удельный вес предприятий с наименьшими, наибольшими и типичными значениями признака.
Таблица 15
Удельный вес предприятий с наибольшими, наименьшими и типичными значениями среднегодовой стоимости ОПФ
Итак, предприятия с номерами 1, 5, 23, 27 имеют наименьшую среднегодовую стоимость ОПФ, и удельный вес этих предприятий в выборке составляет 13,33%; предприятия с номерами 3, 4, 6, 7, 9, 13, 14, 17, 25, 26, 28 имеют типичную для исследуемого ряда среднегодовую стоимость ОПФ, удельный вес этих предприятий 36,67%; предприятия с номерами 12, 16, 21 имеют наибольшую среднегодовую стоимость ОПФ, а удельный вес таких предприятий 10,00%. Следовательно, в исследованном ряде распределения наибольший удельный вес занимают предприятия с типичными значениями среднегодовой стоимости ОПФ, модальный интервал 5125 - 5915 млн. руб.
5. Коэффициент асимметрии для среднегодовой стоимости ОПФ
As=-0,15 <0, а в центральном диапазоне AsП=0,04 <0,5 следовательно, имеет место левосторонняя асимметрия, причем в распределении чаще всего встречаются более низкие значения признака. Доля более низких значений составляет 13,33%, а доля наиболее высоких 10,00%. Это также видно визуально по построенной гистограмме (рис. 1) ряда распределения, приведенной выше в результативных таблицах.
6. Для анализа ожидаемых средних величин среднегодовой стоимости ОПФ и выпуска продукции на предприятиях в целом построена таблица 11, приведенная выше.
Анализируя данные этой таблицы можно сказать, что средняя среднегодовая стоимость ОПФ по всем предприятиям в целом с доверительной вероятностью 68,3% будет заключена в пределах от 5342,39 до 5697,60; с доверительной вероятностью 95,4% - в пределах от 5156,34 до 5883,65; с доверительной вероятностью 99,7% - в пределах от 4954,94 до 6085,05. Средний выпуск продукции на предприятиях в целом с доверительной вероятностью 68,3% будет заключен в пределах от 4940,24 до 5363,98; с доверительной вероятностью 95,4% - в пределах от 4718,30 до 5585,93; с доверительной вероятностью 99,7% - в пределах от 4478,05 до 5826,18.
Ожидаемое максимальное расхождение между максимальным и минимальным значениями среднегодовой стоимости ОПФ на предприятиях в целом составляет 3950 млн. руб. А ожидаемое максимальное расхождение между максимальным и минимальным значениями выпуска продукции на предприятиях в целом составляет 4740 млн. руб.