Пенза
2008
.Содержание
Задание 1. 3
Задание 2 11
Задание 3 18
Задание 4 22
Список используемой литературы 26
ЗАДАНИЯ № 1
Имеются выборочные данные по предприятиям одной из отраслей экономики в отчетном году (выборка 20%-ная механическая)
Таблица 1
Исходные данные
По исходным данным (табл.1) необходимо выполнить следующее:
1.Построить статистический ряд распределения предприятий по среднесписочной численности работников, образовав пять групп с равными интервалами.
2.Графическим методом и путем расчётов определить значения моды и медианы полученного ряда распределения.
3.Рассчитать характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.
4.Вычислить среднюю арифметическую по исходным данным (табл.1), сравнить её с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объяснить причину их расхождения.
Сделать выводы по результатам выполнения Задания 1.
Выполнение Задания 1
Целью выполнения данного Задания является изучение состава и структуры выборочной совокупности предприятий путем построения и анализа статистического ряда распределения предприятий по признаку среднесписочной численности работников.
1.1.Построение интервального ряда распределения предприятий по среднесписочной численности работников
Для построения интервального вариационного ряда, характеризующего распределение предприятий по среднесписочной численности работников, необходимо вычислить величину и границы интервалов ряда.
При построении ряда с равными интервалами величина интервала i определяется по формуле
EMBED Equation.3 , (1)
где EMBED Equation.3 – наибольшее и наименьшее значения признака в исследуемой совокупности, n- число групп интервального ряда.
Определение величины интервала по формуле (1) при заданных n =5, xmax = 220 чел., xmin =120 чел.:
EMBED Equation.3
При i = 20 чел. границы интервалов ряда распределения имеют следующий вид (табл. 2):
Таблица 2
Границы интервалов ряда распределения
Для построения интервального ряда необходимо подсчитать число предприятий, входящих в каждую группу (частоты групп).
Процесс группировки единиц совокупности по признаку среднесписочная численность работников представлен во вспомогательной (разработочной) таблице 3 (графа 4 этой таблицы необходима для построения аналитической группировки в Задании 2).
Таблица 3
Разработочная таблица для построения интервального ряда распределения и аналитической группировки
На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая таблица 4, представляющая интервальный ряд распределения предприятий по среднесписочной численности работников.
Таблица 4
Распределение предприятий по среднесписочной численности работников
Приведем еще три характеристики полученного ряда распределения - частоты групп в относительном выражении, накопленные (кумулятивные) частоты fk, получаемые путем последовательного суммирования частот всех предшествующих (i-1) интервалов, и накопленные частости, рассчитываемые по формуле EMBED Equation.3
Таблица 5
Структура предприятий по среднесписочной численности работников
Вывод. Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по среднесписочной численности работников не является равномерным: преобладают предприятия со среднесписочной численностью от 160 чел. до 180 чел. (это 11 предприятий, доля которых составляет 36,7%); 26,7% предприятий имеют среднесписочную численность менее 160 чел., а 63,3% – менее 180 чел.
1.2.Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов
Для определения моды графическим методом строим по данным табл. 4 (графы 2 и 3) гистограмму распределения предприятий по изучаемому признаку.
Рис. 1. Определение моды графическим методом
Расчет конкретного значения моды для интервального ряда распределения производится по формуле:
EMBED Equation.3 (3)
где хМo – нижняя граница модального интервала,
iMo – величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл. 4 модальным интервалом построенного ряда является интервал 160 - 180 чел., т.к. он имеет наибольшую частоту (f3=11). Расчет моды:
EMBED Equation.3
Вывод. Для рассматриваемой совокупности предприятий наиболее распространенная среднесписочная численность работников характеризуется средней величиной 172 человека.
Для определения медианы графическим методом строим по данным табл. 5 (графы 2 и 5) кумуляту распределения предприятий по изучаемому признаку.
Рис. 2. Определение медианы графическим методом
Расчет конкретного значения медианы для интервального ряда распределения производится по формуле
EMBED Equation.3, (4)
где хМе– нижняя граница медианного интервала,
iМе – величина медианного интервала,
EMBED Equation.3– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Определяем медианный интервал, используя графу 5 табл. 5. Медианным интервалом является интервал 160-180 чел., т.к. именно в этом интервале накопленная частота fk = 19 впервые превышает полусумму всех частот (EMBED Equation.3).
Расчет медианы:
EMBED Equation.3
Вывод. В рассматриваемой совокупности предприятий половина фирм имеют среднесписочную численность работников не более 173 человек, а другая половина – не менее 173 человек.
1.3. Расчет характеристик ряда распределения
Для расчета характеристик ряда распределения EMBED Equation.3 , ?, ?2, V? на основе табл. 5 строим вспомогательную таблицу 6 ( EMBED Equation.3 – середина интервала).
Таблица 6
Расчетная таблица для нахождения характеристик ряда распределения
Рассчитаем среднюю арифметическую взвешенную:
EMBED Equation.3
Рассчитаем среднее квадратическое отклонение:
EMBED Equation.3
Рассчитаем дисперсию:
EMBED Equation.3чел.
Рассчитаем коэффициент вариации:
EMBED Equation.3
Вывод. Анализ полученных значений показателей EMBED Equation.3 и ? говорит о том, что средняя величина среднесписочной численности работников составляет 173 чел., отклонение от этой величины в ту или иную сторону составляет в среднем 23 чел. (или 13,29%), наиболее характерная среднесписочная численность работников находится в пределах от 150 до 196 чел. (диапазон EMBED Equation.3 ).
Значение V? = 13,29% не превышает 33%, следовательно, вариация среднесписочной численности работников в исследуемой совокупности предприятий незначительна и совокупность по данному признаку однородна. Расхождение между значениями EMBED Equation.3 , Мо и Ме незначительно ( EMBED Equation.3 =173 чел., Мо=172 чел., Ме=173 чел.), что подтверждает вывод об однородности совокупности предприятий. Таким образом, найденное среднее значение среднесписочной численности работников (173 чел.) является типичной, надежной характеристикой исследуемой совокупности предприятий.
1.4. Вычисление средней арифметической по исходным данным о среднесписочной численности работников предприятий
Для расчета применяется формула средней арифметической простой:
EMBED Equation.3,
Причина расхождения средних величин, рассчитанных по исходным данным (173 чел.) и по интервальному ряду распределения (172,667 чел.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти предприятий, а во втором случае в качестве значений признака берутся середины интервалов EMBED Equation.3 и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают (173 чел.), что говорит о достаточно равномерном распределении численности работников внутри каждой группы интервального ряда.
Задание 2
По исходным данным (табл. 1) с использованием результатов выполнения Задания 1 необходимо выполнить следующее:
Установить наличие и характер связи между признаками Среднесписочная численность работников и Объём выпуска продукции, используя методы:
а) аналитической группировки;
б) корреляционной таблицы.
2. Измерить тесноту корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение.
Сделать выводы по результатам выполнения задания 2.
Выполнение задания 2
Целью выполнения данного задания является выявление наличия корреляционной связи между факторным и результативным признаками, а также установление направления связи и оценка ее тесноты.
По условию Задания 2 факторным является признак Среднесписочная численность работников, результативным – признак Объем выпуска продукции.
2.1. Установление наличия и характера корреляционной связи между признаками Среднесписочная численность работников и Объём выпуска продукции методами аналитической группировки и корреляционных таблиц
2.1а. Применение метода аналитической группировки
Аналитическая группировка строится по факторному признаку Х и для каждой i-ой группы ряда определяется среднегрупповое значение EMBED Equation.3 результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения EMBED Equation.3 систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х- Среднесписочная численность работников и результативным признаком Y - Объём выпуска продукции.
Групповые средние значения EMBED Equation.3 получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 7:
Таблица 7
Зависимость объема выпуска продукции от среднесписочной численности работников
Вывод. Анализ данных табл. 7 показывает, что с увеличением среднесписочной численности работников от группы к группе систематически возрастает и средний объем выпуска продукции по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
2.1.б. Применение метода корреляционных таблиц
Корреляционная таблица строится как комбинация двух рядов распределения по факторному признаку Х и результативному признаку Y. На пересечении i-ой строки и n-ой графы таблицы указывается число единиц совокупности, входящих в i-ый интервал по признаку X и в n-ый интервал по признаку Y. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками - прямой или обратной. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему, обратная - по диагонали от правого верхнего угла к левому нижнему.
Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Для факторного признака Х – Среднесписочная численность работников эти величины известны из табл. 4 Определяем величину интервала для результативного признака Y – Объем выпуска продукции при n = 4, уmax = 74 млн руб., уmin = 14 млн руб.:
EMBED Equation.3
Границы интервалов ряда распределения результативного признака Y имеют вид:
Таблица 8
Подсчитывая для каждой группы число входящих в нее фирм с использованием принципа полуоткрытого интервала [ ), получаем интервальный ряд распределения результативного признака (табл. 9).
Таблица 9
Интервальный ряд распределения предприятий по объёму выпуска продукции
Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 10).
Таблица 10
Корреляционная таблица зависимости объема продаж
от среднесписочной численности менеджеров
Вывод. Анализ данных табл. 10 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между среднесписочной численностью работников и объемом выпуска продукции.
2.2. Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Коэффициент детерминации характеризует силу влияния факторного (группировочного) признака Х на результативный признак Y и рассчитывается как доля межгрупповой дисперсии EMBED Equation.3 признака Y в его общей дисперсии EMBED Equation.3:
EMBED Equation.3 (9)
где EMBED Equation.3 – общая дисперсия признака Y,
EMBED Equation.3 – межгрупповая (факторная) дисперсия признака Y.
Общая дисперсия EMBED Equation.3 характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных) и вычисляется по формуле
EMBED Equation.3, (10)
где yi – индивидуальные значения результативного признака;
EMBED Equation.3 – общая средняя значений результативного признака;
n – число единиц совокупности.
Межгрупповая дисперсия EMBED Equation.3 измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка) и вычисляется по формуле
EMBED Equation.3 , (11)
где EMBED Equation.3 –групповые средние,
EMBED Equation.3 – общая средняя,
EMBED Equation.3 –число единиц в j-ой группе,
n – число групп.
Для расчета показателей EMBED Equation.3и EMBED Equation.3 необходимо знать величину общей средней EMBED Equation.3 , которая вычисляется как средняя арифметическая простая по всем единицам совокупности:
EMBED Equation.3 , (12)
Значения числителя и знаменателя формулы имеются в табл. 7 (графы 3 и 4 итоговой строки). Используя эти данные, получаем общую среднюю EMBED Equation.3 :
EMBED Equation.3 = EMBED Equation.3 =46 млн. руб.
Для расчета общей дисперсии EMBED Equation.3 применяется вспомогательная таблица 11.
Таблица 11
Вспомогательная таблица для расчета общей дисперсии
Рассчитаем общую дисперсию:
EMBED Equation.3=EMBED Equation.3
Для расчета межгрупповой дисперсии EMBED Equation.3 строится вспомогательная таблица 12, при этом используются групповые средние значения EMBED Equation.3 из табл. 7 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Рассчитаем межгрупповую дисперсию:
EMBED Equation.3EMBED Equation.3
Определяем коэффициент детерминации:
EMBED Equation.3 или 91,9%
Вывод. 91,9% вариации объёма выпуска продукции предприятиями обусловлено вариацией среднесписочной численности работников, а 8,1% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
EMBED Equation.3 (13)
Рассчитаем показатель :
EMBED Equation.3 или 95,9%
Вывод: согласно шкале Чэддока связь между среднесписочной численностью менеджеров и объёмом продаж фирмами является весьма тесной.
Задание 3
По результатам выполнения Задания 1 с вероятностью 0,683 необходимо определить:
ошибку выборки среднесписочной численности работников, и границы, в которых будет находиться среднесписочная численность работников в генеральной совокупности.
ошибку выборки доли предприятий со среднесписочной численностью работников 180 и более человек и границы, в которых будет находиться генеральная доля.
Выполнение Задания 3
Целью выполнения данного Задания является определение для генеральной совокупности предприятий границ, в которых будут находиться средняя величина среднесписочной численности работников, и доля предприятий со среднесписочной численностью работников не менее 180 человек.
3.1. Определение ошибки выборки для величины среднесписочной численности работников, а также границ, в которых будет находиться генеральная средняя
Применяя выборочный метод наблюдения, необходимо рассчитать ошибки выборки (ошибки репрезентативности), т.к. генеральные и выборочные характеристики, как правило, не совпадают, а отклоняются на некоторую величину ?.
Принято вычислять два вида ошибок выборки - среднюю EMBED Equation.3 и предельную EMBED Equation.3 .
Для расчета средней ошибки выборки EMBED Equation.3 применяются различные формулы в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.
Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка EMBED Equation.3 для выборочной средней EMBED Equation.3 определяется по формуле:
EMBED Equation.3 , (14)
где EMBED Equation.3 – общая дисперсия изучаемого признака,
N – число единиц в генеральной совокупности,
n – число единиц в выборочной совокупности.
Предельная ошибка выборки EMBED Equation.3 определяет границы, в пределах которых будет находиться генеральная средняя:
EMBED Equation.3 , (15)
где EMBED Equation.3 – выборочная средняя,
EMBED Equation.3 – генеральная средняя.
Предельная ошибка выборки EMBED Equation.3 кратна средней ошибке EMBED Equation.3 с коэффициентом кратности t (называемым также коэффициентом доверия):
EMBED Equation.3
Коэффициент кратности t зависит от значения доверительной вероятности Р, гарантирующей вхождение генеральной средней в интервал EMBED Equation.3 , называемый доверительным интервалом.
В данной работе используется доверительная вероятность Р=0,683 и соответствующие ей значение t =1
По условию Задания 2 выборочная совокупность насчитывает 30 предприятий, выборка 20% механическая, следовательно, генеральная совокупность включает 150 предприятий. Выборочная средняя EMBED Equation.3 , дисперсия EMBED Equation.3 определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 15:
Таблица 14
Рассчитаем среднюю ошибку выборки:
EMBED Equation.3
Рассчитаем предельную ошибку выборки:
EMBED Equation.3
Определим доверительный интервал для генеральной средней:
EMBED Equation.3
EMBED Equation.3
или
EMBED Equation.3
Вывод. На основании проведенного выборочного обследования с вероятностью 0,683 можно утверждать, что для генеральной совокупности предприятий средняя величина среднесписочной численности работников находится в пределах от 159 до 187 человек.
3.2. Определение ошибки выборки для доли фирм со среднесписочной численностью менеджеров 180 человек и более, а также границ, в которых будет находиться генеральная доля
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой:
EMBED Equation.3 , (16)
где m – число единиц совокупности, обладающих заданным свойством;
n – общее число единиц в совокупности.
Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки EMBED Equation.3 доли единиц, обладающих заданным свойством, рассчитывается по формуле
EMBED Equation.3 , (17)
где w – доля единиц совокупности, обладающих заданным свойством;
(1-w) – доля единиц совокупности, не обладающих заданным свойством,
N – число единиц в генеральной совокупности,
n- число единиц в выборочной совокупности.
Предельная ошибка выборки EMBED Equation.3 определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих исследуемым признаком:
EMBED Equation.3 , (18)
По условию Задания 3 исследуемым свойством фирм является равенство или превышение среднесписочной численности менеджеров величины 180 человек.
Число фирм с данным свойством определяется из табл. 3 (графа 3):
m=11
Рассчитаем выборочную долю:
EMBED Equation.3
Рассчитаем предельную ошибку выборки для доли:
EMBED Equation.3
Определим доверительный интервал генеральной доли:
0,367-0,079 < P < 0,367+0,079
0,288 < P < 0,446
Или 28,8 %< P < 44,6 %
Вывод. С вероятностью 0,683 можно утверждать, что в генеральной совокупности предприятий доля предприятий со среднесписочной численностью работников 180 человек и более будет находиться в пределах от 28,8% до 44,6%.
Задание 4
Имеются следующие данные по двум предприятиям отрасли:
Таблица 15
Определить:
1.По каждому предприятию уровни и динамику производительности труда.
Результаты расчетов представить в таблице.
2.По двум предприятиям вместе:
–индексы производительности труда (переменного, постоянного состава, структурных сдвигов);
–абсолютное изменение средней производительности труда за счет отдельных факторов.
Сделать выводы.
Выполнение Задания 4
4.1 Определение уровня и динамики производительности труда по каждому предприятию
Анализ интенсивности изменения во времени осуществляется с помощью показателей, получаемых в результате сравнения уровней. К таким показателям относятся: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента прироста.
Система средних показателей включает средний уровень ряда, средний абсолютный прирост, средний темп роста, средний темп прироста.
Абсолютный прирост рассчитывается по формуле (19)
EMBED Equation.3 , (19)
Где EMBED Equation.3 - изучаемый уровень ряда,
EMBED Equation.3 - базисный уровень ряда.
Темп роста рассчитывается по формуле (20):
EMBED Equation.3 (20)
Темп прироста рассчитывается по формуле (21):
EMBED Equation.3 (21)
Абсолютное значение одного процента прироста рассчитывается по формуле (22):
EMBED Equation.3 (22)
Производительность труда рассчитывается по формуле (23):
EMBED Equation.3 (23)
Результаты расчета показателей представлены в таблице 16.
Таблица 16
Вывод. На первом предприятии производительность труда в отчетном периоде относительно базисного выросла на 11000 руб., что составляет 17%, а на втором предприятии на 20000 руб, что составляет 25%. Каждый процент прироста принес предприятию №1 дополнительно 639,91 рублей, а предприятию №2 800 рублей.
4.2 Определение по двум предприятиям вместе: индекса производительности труда (переменного, постоянного состава, структурных сдвигов); абсолютного изменения средней производительности труда за счет отдельных факторов.
Индекс переменного состава отражает динамику среднего показателя (для однородной совокупности) за счет изменения индексируемой величины x у отдельных элементов (частей целого) и за счет изменения весов f, по которым взвешиваются отдельные значения x. Любой индекс переменного состава – это отношение двух средних величин для однородной совокупности (за два периода или по двум территориям):
EMBED Equation.3 (24)
Величина этого индекса характеризует изменение средневзвешенной средней за счет влияния двух факторов: осредняемого показателя у отдельных единиц совокупности и структуры изучаемой совокупности.
Индекс постоянного состава отражает динамику среднего показателя лишь за счет изменения индексируемой величины x, при фиксировании весов на уровне, как правило, отчетного периода EMBED Equation.3:
EMBED Equation.3 (25)
Другими словами, индекс фиксированного состава исключает влияние изменения структуры (состава) совокупности на динамику средних величин, рассчитанных для двух периодов при одной и той же фиксированной структуре.
Индекс структурных сдвигов характеризует влияние изменения структуры изучаемого явления на динамику среднего уровня индексируемого показателя и рассчитывается по формуле:
EMBED Equation.3 (26)
Для расчета индексов воспользуемся вспомогательной таблицей (17).
Таблица 17
EMBED Equation.3 (122%)
В целом производительность труда выросла на 22% по сравнению с базисным, за счет влияния изменений производительности труда по каждому предприятию и за счет структурных изменений в численности работников.
EMBED Equation.3 (121%)
Уровень производительности труда в целом увеличился на 21% по сравнению с базисным периодом за счет влияния изменений производительности труда по каждому предприятию.
EMBED Equation.3 (101%)
Уровень производительности труда в целом увеличился на 1% по сравнению с базисным периодом за счет влияния структурных изменений в численности работников по каждому предприятию.
Абсолютное изменение производительности труда за счет:
1.Влияния уровня производительности труда по каждому предприятию.
EMBED Equation.3руб.
Т.о производительность труда увеличивается на 14857,14 руб.
2.Влияние структурных изменений в численности работников.
EMBED Equation.3 руб.
Т.о.производительность труда увеличивается на 857,14.
Список использованной литературы
Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ - ДАНА, 2001.
Гусаров В.М. Статистика: Учеб пособие/ В.М. Гусаров, Е.И. Кузнецова. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2007.
Практикум по статистике: Учеб. пособие для вузов/ Под ред. В.М. Симчеры. - М.: Финстатинформ, 1999.