г. Москва, 2001 г.
Задача №1.
Имеются следующие выборочные данные (выборка 10%-ная, механическая) по предприятиям одной из отраслей промышленности:
По исходным данным:
Постройте статистический ряд распределения предприятий по выпуску продукции, образовав пять групп с равными интервалами. Постройте графики ряда распределения.
Рассчитайте характеристики ряда распределения предприятий по выпуску продукции: среднюю арифметическую, среднее квадратическое отклонение, дисперсию, коэффициент вариации.
Сделайте выводы.
С вероятностью 0,954 определите ошибку выборки среднего выпуска на одно предприятие и границы, в которых будет находиться средний выпуск продукции отрасли в генеральной совокупности.
Cодержание и краткое описание применяемых методов:
Статистическая группировка в зависимости от решаемых задач подразделяются на типологические, структурные аналитические. Статистическая группировка позволяет дать характеристику размеров, структуры и взаимосвязи изучаемых явлений, выявить их закономерности.
Важным направлением в статистической сводке является построение рядов распределения, одно из назначений которых состоит в изучении структуры исследуемой совокупности, характера и закономерности распределения.
Ряд распределения – это простейшая группировка, представляющая собой распределение численности единиц совокупности по значению какого-либо признака.
Ряды распределения, в основе которых лежит качественный признак, называют атрибутивным. Если ряд построен по количественному признаку, его называют вариационным.
При построении вариационного ряда с равными интервалами определяют его число групп ( EMBED Equation.3 ) и величину интервала ( EMBED Equation.3 ). Оптимальное число групп может быть определено по формуле Стерджесса:
EMBED Equation.3 , (1)
где EMBED Equation.3 - число единиц совокупности.
Величина равного интервала рассчитывается по формуле:
EMBED Equation.3 (2)
где EMBED Equation.3 – число выделенных интервалов.
Средняя – является обещающей характеристикой совокупности единиц по качественно однородному признаку.
В статистике применяются различные виды средних: арифметическая, гармоническая, квадратическая, геометрическая и структурные средние – мода и медиана. Средние, кроме моды и медианы, исчисляются в двух формах: простой и взвешенной. Выбор формы средней зависит от исходных данных и содержание определяемого показателя. Наибольшее распространение получила средняя арифметическая, как простая, так и взвешенная.
Средняя арифметическая простая равна сумме значений признака, деленной на их число:
EMBED Equation.3 , (3)
где EMBED Equation.3 – значение признака (вариант);
EMBED Equation.3 –число единиц признака.
Средняя арифметическая простая применяется в тех случаях, когда варианты представлены индивидуально в виде их перечня в любом порядке или в виде ранжированного ряда.
Если данные представлены в виде дискретных или интервальных рядов распределения, в которых одинаковые значения признака ( EMBED Equation.3 ) объединены в группы, имеющие различное число единиц ( EMBED Equation.3 ), называемое частотой (весом), применяется средняя арифметическая взвешенная:
EMBED Equation.3
(4)
Для измерения степени колеблемости отдельных значений признака от средней исчисляются основные обобщающие показатели вариации: дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Дисперсия ( EMBED Equation.3 ) – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической. В зависимости от исходных данных дисперсия вычисляется по формуле средней арифметической простой или взвешенной:
EMBED Equation.3 - невзвешенния (простая); (5)
EMBED Equation.3 - взвешенная. (6)
Среднее квадратическое отклонение ( EMBED Equation.3 ) представляет собой корень квадратный из дисперсии и рано:
EMBED Equation.3 - невзвешенния; (7)
EMBED Equation.3 - взвешенная. (8)
В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (рублях, тоннах, процентах и т.д.).
Для сравнения размеров вариации различных признаков, а также для сравнения степени вариации одноименных признаков в нескольких совокупностях исчисляется относительный показатель вариации – коэффициент вариации ( EMBED Equation.3 ), который представляет собой процентное отношение среднего квадратического отклонения и средней арифметической:
EMBED Equation.3
(9)
По величине коэффициента вариации можно судить о степени вариации признаков, а, следовательно, об однородности состава совокупности. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по составу.
При механическом отборе предельная ошибка выборки определяется по формуле:
EMBED Equation.3
(10)
Решение:
1. Сначала определим длину интервала по формуле (2):
EMBED Equation.3
19,0-50,8; 50,8-82,6; 82,6-114,4; 114,4-146,2; 146,2-178,0