EMBED MSPhotoEd.3 ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности в среде MS Excel»
Вариант № 20
Выполнил:
Проверил: ________________________
Должность
_________________________________________
Ф.И.О.
Москва
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (EMBED Equation.3), моду (Мо), медиану (Ме), размах вариации (R), дисперсию ( EMBED Equation.3 ), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ).
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду (Мо) полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности
Рассчитать генеральную дисперсию ( EMBED Equation.3 ), генеральное среднее квадратическое отклонение ( EMBED Equation.3 ) и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии (As) и эксцесса (Ek). На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Для решения ряда статистических задач для выборочной и генеральной совокупностей в процессе исследования совокупности оформим рабочий файл.
Рисунок 3
Гистограмма распределения предприятий по стоимости основных производственных фондов
Статистический анализ выборочной совокупности
1. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
В результате визуального анализа диаграммы рассеяния признаков единиц изучаемой совокупности (рисунок 1 «Рабочего файла») выявлены следующие аномальные единицы наблюдения, представленные в таблице 2 «Рабочего файла»:
Рисунок 1
Точечная диаграмма рассеяния признаков изучаемой совокупности
Приведенные в таблице 2 аномальные единицы наблюдения удалены из изучаемой совокупности. Корреляционное поле имеет вид:
Рисунок 2
Точечная диаграмма рассеяния признаков изучаемой совокупности
После исключения аномальных единиц наблюдения из изучаемой совокупности исходные данные принимают вид, представленный в таблице 1А «Рабочего файла»:
2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (EMBED Equation.3), моду (Мо), медиану (Ме), размах вариации (R), дисперсию ( EMBED Equation.3 ), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
Обобщающие статистические показатели совокупности по изучаемым признакам в результате расчетов представлены в таблице 3 и в таблице 5 «Рабочего файла»:
На основе этих таблиц сформируем единую таблицу значений выборочных показателей (таблица 8):
3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков совокупности
Степень колеблемости значений признаков совокупности оценивается по величине коэффициента вариации EMBED Equation.3 : если EMBED Equation.3 < EMBED Equation.3 - колеблемость незначительная; если 40%< EMBED Equation.3 - колеблемость средняя (умеренная); если EMBED Equation.3 >60% - колеблемость значительная.
Коэффициент вариации для признака Среднегодовая стоимость основных производственных фондов составляет 17,097%, что свидетельствует о незначительной колеблемости значений признаков изучаемой совокупности. Коэффициент вариации для признака Выпуск продукции составляет 21,750% , что свидетельствует о незначительной колеблемости значений признаков изучаемой совокупности.
б) степень однородности совокупности по изучаемым признакам
Для нормальных и близких к нормальному распределений коэффициент вариации EMBED Equation.3 служит индикатором однородности совокупности. Принято считать, что при выполнимости неравенства EMBED Equation.3 , совокупность является количественно однородной по данному признаку.
Коэффициент вариации для признака Среднегодовая стоимость основных производственных фондов составляет 17,097%, что свидетельствует о количественной однородности изучаемой совокупности. Коэффициент вариации для признака Выпуск продукции составляет 21,750% , что свидетельствует о количественной однородности изучаемой совокупности.
в) устойчивость индивидуальных значений признаков
Вывод об устойчивости индивидуальных значений признака позволяет сделать сопоставление средних отклонений – квадратического EMBED Equation.3 и линейного EMBED Equation.3 .
В условиях симметричного и нормального, а также близких к ним распределений между показателями EMBED Equation.3 и EMBED Equation.3 имеют место равенства: EMBED Equation.3 , EMBED Equation.3 . Поэтому отношение показателей EMBED Equation.3 и EMBED Equation.3 может служить индикатором устойчивости данных: если EMBED Equation.3 >0,8, то значения признака неустойчивы, в них имеются аномальные выбросы.
Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдений, некоторые аномалии в исходных данных продолжают сохраняться. В этом случае их следует выявить и рассматривать в качестве возможных «кандидатов» на исключение из выборки.
Для признака Среднегодовая стоимость основных производственных фондов EMBED Equation.3 = EMBED Equation.3 (0,791<0,8), что свидетельствует об устойчивости индивидуальных значений признака изучаемой совокупности и об отсутствии некоторых аномалий в исходных данных, которые следует рассматривать в качестве возможных «кандидатов» на исключение из выборки. Для признака Выпуск продукции EMBED Equation.3 = EMBED Equation.3 (0,757<0,8), что свидетельствует об устойчивости индивидуальных значений признака изучаемой совокупности и об отсутствии некоторых аномалий в исходных данных, которые следует рассматривать в качестве возможных «кандидатов» на исключение из выборки.
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 )
По значениям показателей EMBED Equation.3 и EMBED Equation.3 можно определить границы диапазонов рассеяния значений признака относительно средней EMBED Equation.3 , т.е. установить, какая доля значений признака попадет в тот или иной диапазон отклонений от EMBED Equation.3 .
В нормально распределенных и близких к ним рядах вероятностные оценки диапазонов рассеяния значений признака таковы:
68,3% значений признака войдет в диапазон ( EMBED Equation.3 );
95,4% значений признака попадет в диапазон ( EMBED Equation.3 ); (*)
99,7% значений признака появится в диапазоне ( EMBED Equation.3 ).
Соотношение (*) известно как правило «трех сигм».
Распределение значений признака по диапазонам рассеяния приведем в таблице 9:
Таблица 9
Распределение значений признака по диапазонам рассеяния признака относительно EMBED Equation.3
На основе данных таблицы 9 определим процентное соотношение рассеяния значений признака по трем диапазонам и полученные данные отразим в таблице 9А:
Таблица 9А
Процентное соотношение рассеяния значений признака по диапазонам
Следовательно,
Для признака Среднегодовая стоимость основных производственных фондов вероятностные оценки диапазонов рассеяния значений признака таковы:
66,67% значений признака войдет в диапазон (1264-1796);
93,33% значений признака попадет в диапазон (998-2062);
100% значений признака появится в диапазоне (732-2328).
Для признака Среднегодовая стоимость основных производственных фондов ожидаемые оценки диапазонов рассеяния значений признака по правилу «трех сигм» таковы:
68,3% значений признака войдет в диапазон (1264-1796);
95,4% значений признака попадет в диапазон (998-2062);
99,7% значений признака появится в диапазоне (732-2328).
Для признака Выпуск продукции вероятностные оценки диапазонов рассеяния значений признака таковы:
63,33% значений признака войдет в диапазон (1117-1752);
93,33% значений признака попадет в диапазон (800-2070);
100% значений признака появится в диапазоне (483-2387).
Для признака Выпуск продукции ожидаемые оценки диапазонов рассеяния значений признака по правилу «трех сигм» таковы:
68,3% значений признака войдет в диапазон (1117-1752);
95,4% значений признака попадет в диапазон (800-2070);
99,7% значений признака появится в диапазоне (483-2387).
Сопоставляя вероятностные оценки диапазонов рассеяния значений признака и ожидаемые оценки диапазонов рассеяния значений признака по правилу «трех сигм» для признака Среднегодовая стоимость основных производственных фондов можно сделать вывод о том, что распределение значений признака по диапазонам рассеяния признака относительно EMBED Equation.3 близко к нормальному.
Сопоставляя вероятностные оценки диапазонов рассеяния значений признака и ожидаемые оценки диапазонов рассеяния значений признака по правилу «трех сигм» для признака Выпуск продукции можно сделать вывод о том, что распределение значений признака по диапазонам рассеяния признака относительно EMBED Equation.3 близко к нормальному.
4. Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков
Коэффициент вариации для признака Среднегодовая стоимость основных производственных фондов меньше, чем коэффициент вариации для признака Выпуск продукции, так как 17,097%<21,750% ( EMBED Equation.3 < EMBED Equation.3 ). Следовательно, степень колеблемости признака Среднегодовая стоимость основных производственных фондов меньше, чем степень колеблемости признака Выпуск продукции.
б) количественной однородности единиц
Для признака Среднегодовая стоимость основных производственных фондов изучаемая совокупность количественно однородна, так как 17,097%?33% ( EMBED Equation.3 ). Для признака Выпуск продукции изучаемая совокупность количественно однородна, так как 21,750%?33% ( EMBED Equation.3 ). Следовательно, изучаемая совокупность признака Среднегодовая стоимость основных производственных фондов более количественно однородна, чем изучаемая совокупность признака Выпуск продукции ( EMBED Equation.3 ).
в) надежности (типичности) средних значений признаков
Для признака Среднегодовая стоимость основных производственных фондов средняя арифметическая величина EMBED Equation.3 является надежной характеристикой, так как 17,097%?40% ( EMBED Equation.3 ). Для признака Выпуск продукции средняя арифметическая величина EMBED Equation.3 является надежной характеристикой, так как 21,750%?40% ( EMBED Equation.3 ). Следовательно, средняя арифметическая величина EMBED Equation.3 для признака Среднегодовая стоимость основных производственных фондов является более надежной характеристикой, чем средняя арифметическая величина EMBED Equation.3 для признака Выпуск продукции ( EMBED Equation.3 ).
г) симметричности распределений в центральной части ряда
Для оценки асимметричности распределения значений признака в центральном диапазоне ( EMBED Equation.3 ) служит коэффициент К.Пирсона ( EMBED Equation.3 ). При правосторонней асимметрии EMBED Equation.3 >0, при левосторонней асимметрии EMBED Equation.3 <0. Если EMBED Equation.3 =0, то имеет место симметричность распределений в центральной части ряда.
Для признака Среднегодовая стоимость основных производственных фондов EMBED Equation.3 <0 ( EMBED Equation.3 = -0,21025237), следовательно, имеет место левосторонняя асимметрия распределения значений признака в центральной части. Для признака Выпуск продукции EMBED Equation.3 >0 ( EMBED Equation.3 = 0,015275091), следовательно, имеет место правосторонняя асимметрия распределения значений признака в центральной части.
5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду (Мо) полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Интервальный вариационный ряд представлен в таблице 7 «Рабочего файла»:
Гистограмма распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов представлена на рисунке 3 «Рабочего файла»:
Рисунок 3
Гистограмма распределения предприятий по стоимости основных производственных фондов
При анализе формы гистограммы прежде всего следует оценить распределение вариантов значений признака по интервалам (группам). Если на гистограмме четко прослеживаются два-три «горба» частот вариантов, это говорит о том, что значения признака концентрируются сразу в нескольких интервалах, и, следовательно, распределение не является однородным. Если гистограмма имеет одновершинную форму, есть основания полагать, что выборка является однородной по данному признаку.
В результате визуального анализа гистограммы приходим к выводу о том, что гистограмма распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов имеет одновершинную форму, и, следовательно, есть основания полагать, что выборка является однородной по данному признаку.
Нормальное распределение является симметричным, если для него выполняется соотношение: EMBED Equation.3 .
Для признака Среднегодовая стоимость основных производственных фондов соотношение EMBED Equation.3 не выполняется, так как EMBED Equation.3 . Нарушение этого соотношения свидетельствует о наличии асимметрии распределения.
Для оценки асимметричности распределения значений признака служит коэффициент К.Пирсона ( EMBED Equation.3 ). При правосторонней асимметрии EMBED Equation.3 >0, при левосторонней асимметрии EMBED Equation.3 <0. Правосторонняя асимметрия означает, что в распределении чаще встречаются более высокие значения признака. Левосторонняя асимметрия означает, что в распределении чаще встречаются более низкие значения признака.
Для признака Среднегодовая стоимость основных производственных фондов EMBED Equation.3 <0 ( EMBED Equation.3 = -0,21025237), следовательно, имеет место левосторонняя асимметрия распределения значений признака. Левосторонняя асимметрия означает, что в распределении чаще встречаются более низкие значения признака.
Рассчитаем моду (Мо) полученного интервального ряда и сравним ее с показателем Мо несгруппированного ряда данных.
Для полученного интервального ряда значение моды (Мо) рассчитывается по формуле: EMBED Equation.3 , где
EMBED Equation.3 - нижняя граница модального интервала; EMBED Equation.3 - величина модального интервала; EMBED Equation.3 - частота модального интервала; EMBED Equation.3 - частота интервала, предшествующего модальному; EMBED Equation.3 - частота интервала, следующего за модальным.
EMBED Equation.3
Для несгруппированного ряда данных значение моды (Мо) равное 1585 млн. руб. отражено в таблице 3 «Рабочего файла»:
Расхождение между значениями моды объясняется тем, что для интервального ряда значение моды рассчитывалось по средним значениям, а для несгруппированного ряда – по фактическим значениям.
Статистический анализ генеральной совокупности
1. Рассчитать генеральную дисперсию ( EMBED Equation.3 ), генеральное среднее квадратическое отклонение ( EMBED Equation.3 ) и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Генеральные показатели изучаемой совокупности рассчитаны с помощью инструмента «Описательная статистика», и их значения представлены в таблице 3 «Рабочего файла»:
Сформируем для генеральных показателей изучаемой совокупности отдельную таблицу (таблица 10):
При малом числе наблюдений (n?40-50) для вычисления генеральной дисперсии ( EMBED Equation.3 ) по выборочной дисперсии ( EMBED Equation.3 ) можно воспользоваться формулой: EMBED Equation.3 . Установим степень расхождения между EMBED Equation.3 и EMBED Equation.3 : EMBED Equation.3 .
В условиях близости распределения единиц генеральной совокупности к нормальному для прогнозной оценки размаха вариации признака ( EMBED Equation.3 ) воспользуемся формулой: EMBED Equation.3 . Для признака Среднегодовая стоимость основных производственных фондов EMBED Equation.3 . Для признака Выпуск продукции EMBED Equation.3 .
Для каждого признака прогнозное значение EMBED Equation.3 сравним с EMBED Equation.3 . Для признака Среднегодовая стоимость основных производственных фондов EMBED Equation.3 > EMBED Equation.3 (1596>1100), т.е. прогнозная оценка размаха вариации больше полученного размаха вариации в выборке на 496. Для признака Выпуск продукции EMBED Equation.3 > EMBED Equation.3 (1904>1320), т.е. прогнозная оценка размаха вариации больше полученного размаха вариации в выборке на 584. Т.к. прогнозное значение EMBED Equation.3 для каждого признака незначительно расходится с EMBED Equation.3 , то распределение единиц выборочной совокупности по изучаемым признакам близко к нормальному.
2. Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки
Средняя ошибка выборки для признака Среднегодовая стоимость основных производственных фондов рассчитана с помощью инструмента «Описательная статистика» и отражена в таблице 3 «Рабочего файла» как параметр «Стандартная ошибка» и равна 48,57611636. Средняя ошибка выборки для признака Выпуск продукции рассчитана с помощью инструмента «Описательная статистика» и отражена в таблице 3 «Рабочего файла» как параметр «Стандартная ошибка» и равна 57,9471357.
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Оценки предельных ошибок выборки представлены в таблице 3, таблице 4а, таблице 4б «Рабочего файла»:
На основе этих оценок и формулы EMBED Equation.3 сформируем таблицу 11:
Таблица 11
Предельные ошибки выборки и ожидаемые границы для генеральных средних
3. Рассчитать коэффициенты асимметрии (As) и эксцесса (Ek). На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Коэффициенты асимметрии (As) и эксцесса (Ek) рассчитаны с помощью инструмента «Описательная статистика», и их значения представлены в таблице 10:
Если распределение единиц выборочной совокупности близко к нормальному, выборка является репрезентативной (значение показателей EMBED Equation.3 и EMBED Equation.3 расходятся незначительно) и при этом коэффициенты As и Ek указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно, то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.
Т.к. распределение единиц выборочной совокупности для признака Среднегодовая стоимость основных производственных фондов близко к нормальному, выборка является репрезентативной (значение показателей EMBED Equation.3 и EMBED Equation.3 расходятся незначительно: 70789,17241 и 68429,53333) и при этом коэффициенты As и Ek указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно (коэффициент As = -0,152503649, As?0,25 – асимметрия незначительная; коэффициент Ek = -0,344943844, Ek<0 – вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной, следовательно, значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону), то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.
Т.к. распределение единиц выборочной совокупности для признака Выпуск продукции близко к нормальному, выборка является репрезентативной (значение показателей EMBED Equation.3 и EMBED Equation.3 расходятся незначительно: 100736,1161 и 97378,24556) и при этом коэффициенты As и Ek указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно (коэффициент As =0,042954448, As?0,25 – асимметрия незначительная; коэффициент Ek = -0,205332365, Ek<0 – вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной, следовательно, значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону), то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.
Экономическая интерпретация результатов статистического исследования предприятий
1. Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?
В результате визуального анализа диаграммы рассеяния признаков единиц изучаемой совокупности (рисунок 1 «Рабочего файла») выявлены следующие аномальные единицы наблюдения, представленные в таблице 2 «Рабочего файла»:
Рисунок 1
Точечная диаграмма рассеяния признаков изучаемой совокупности
Приведенные в таблице 2 аномальные единицы наблюдения удалены из изучаемой совокупности. Корреляционное поле имеет вид:
Рисунок 2
Точечная диаграмма рассеяния признаков изучаемой совокупности
После исключения аномальных единиц наблюдения из изучаемой совокупности исходные данные принимают вид, представленный в таблице 1А «Рабочего файла»:
Исходные данные, представленные в таблице 1А «Рабочего файла», образующие выборку предприятия по значениям изучаемых экономических показателей, типичны по значениям изучаемых экономических показателей.
2. Каковы наиболее характерные для предприятий значения показателей среднегодовой стоимости основных производственных фондов и выпуска продукции?
Наиболее характерные для предприятий значения показателей среднегодовой стоимости основных производственных фондов и выпуска продукции таковы:
Средняя арифметическая значений для признака Среднегодовая стоимость основных производственных фондов – 1530 млн. руб. Средняя арифметическая значений для признака Выпуск продукции – 1434,77 млн. руб.
Среднее квадратическое отклонение для признака Среднегодовая стоимость основных производственных фондов – 266,06 млн. руб. Среднее квадратическое отклонение для признака Выпуск продукции –317,39 млн. руб.
Для признака Среднегодовая стоимость основных производственных фондов в диапазон от 1264 млн. руб. до 1796 млн. руб.
( EMBED Equation.3 ), включаются следующие предприятия с наиболее характерными значениями показателей:
Для признака Выпуск продукции в диапазон от 1117 млн. руб. до 1752 млн. руб. ( EMBED Equation.3 ), включаются следующие предприятия с наиболее характерными значениями показателей:
3. Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей?
Для нормальных и близких к нормальному распределений коэффициент вариации EMBED Equation.3 служит индикатором однородности совокупности. Принято считать, что при выполнимости неравенства EMBED Equation.3 , совокупность является количественно однородной по данному признаку.
Коэффициент вариации для признака Среднегодовая стоимость основных производственных фондов составляет 17,097%, что свидетельствует о количественной однородности изучаемой совокупности. Коэффициент вариации для признака Выпуск продукции составляет 21,750% , что свидетельствует о количественной однородности изучаемой совокупности.
Максимальное расхождение в значениях показателей (размах вариации) для признака Среднегодовая стоимость основных производственных фондов составляет 1100 млн. руб. Максимальное расхождение в значениях показателей (размах вариации) для признака Выпуск продукции составляет 1320 млн. руб.
4. Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных производственных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показателя? Какие именно это предприятия?
Интервальный ряд распределения предприятий по стоимости основных производственных фондов представлен в таблице 7 «Рабочего файла»:
Модальный интервал соответствует группе предприятий по стоимости основных производственных фондов от 1420 до 1640 млн. руб., т.к. в эту группу включается наибольшее число предприятий равное 11, а именно:
В группу с наименьшей стоимостью основных производственных фондов от 980 до 1200 млн. руб. включаются 4 предприятия, а именно:
В группу с наибольшей стоимостью основных производственных фондов от 1860 до 2080 млн. руб. включаются 3 предприятия, а именно:
Удельный вес предприятий модального интервала равен 36,67%. Удельный вес предприятий интервала с наименьшими значениями показателя равен 13,33%. Удельный вес предприятий интервала с наибольшими значениями показателя равен 10%.
5. Носит ли распределение предприятий по группам закономерный характер и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности?
Гистограмма распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов представлена на рисунке 3 «Рабочего файла»:
Рисунок 3
Гистограмма распределения предприятий по стоимости основных производственных фондов
В результате визуального анализа гистограммы приходим к выводу о том, в гистограмме распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов имеется определенная закономерность, которая дает основание предполагать, что распределение эмпирических данных близко к нормальному (наблюдается незначительная асимметрия).
Для оценки асимметричности распределения значений признака служит коэффициент К.Пирсона ( EMBED Equation.3 ). При правосторонней асимметрии EMBED Equation.3 >0, при левосторонней асимметрии EMBED Equation.3 <0. Правосторонняя асимметрия означает преимущественное появление в распределении более высоких значений признака. Левосторонняя асимметрия означает, что в распределении чаще встречаются более низкие значения признака.
Для признака Среднегодовая стоимость основных производственных фондов EMBED Equation.3 <0 ( EMBED Equation.3 = -0,21025237), следовательно, имеет место левосторонняя асимметрия распределения значений признака. Левосторонняя асимметрия означает, что в распределении чаще встречаются более низкие значения признака.
6. Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях показателя можно ожидать?
Предельные ошибки средней и границы, в которых будут находиться средние значения показателей, отражены в таблице 11:
Таблица 11
Предельные ошибки выборки и ожидаемые границы для генеральных средних
В условиях близости распределения единиц генеральной совокупности к нормальному для прогнозной оценки размаха вариации признака ( EMBED Equation.3 ) воспользуемся формулой: EMBED Equation.3 . Для признака Среднегодовая стоимость основных производственных фондов EMBED Equation.3 . Для признака Выпуск продукции EMBED Equation.3 .