Федеральное агентство по образованию
ГОУ ВПО
Всероссийский заочный финансово-экономический институт
Кафедра статистики
КОНТРОЛЬНАЯ РАБОТА
по дисциплине
«СТАТИСТИКА»
Вариант №13
Исполнитель:
Специальность: Бухгалтерский учет, анализ и аудит
Группа:
№ зачетной книжки: Преподаватель:
ПЕНЗА
2008
Вариант №13
Имеются следующие выборочные данные по предприятиям одной из отраслей промышленности в отчетном году (выборка 5%-ная механическая).
Выборочные данные представлены в табл.1.
Исходные данные Таблица 1
Задание 1
По исходным данным (табл.1):
Построить статистический ряд распределения организаций (предприятий) по признаку среднесписочная численность работников, образовав пять групп с равными интервалами.
Построить графики полученного ряда распределения. Графически определить значения моды и медианы.
Рассчитать характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации, моду и медиану.
Вычислить среднюю арифметическую по исходным данным (табл. 1), сравнить её с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объяснить причину их расхождения.
Сделать выводы по результатам выполнения задания.
Решение:
1.1. Построение статистического ряда распределения
Для построения статистический ряд распределения необходимо вычислить величину и границы интервалов ряда. Исходные данные представлены в таблице 2 (графа 5 этой таблицы необходима для выполнения Задания 2).
Таблица 2
Исходные данные
При построении ряда с равными интервалами величина интервала h определяется по формуле
EMBED Equation.3 , (1)
где xmax, xmin – наибольшее и наименьшее значения признака в исследуемой совокупности, k- число групп интервального ряда.
Определяем величины интервала по формуле (1) при заданных k =5, xmax = 220 чел., xmin = 120 чел.:
EMBED Equation.3
При h = 20. границы интервалов ряда распределения имеют следующий вид (табл. 3):
Таблица 3
Для построения интервального ряда необходимо подсчитать число организаций, входящих в каждую группу (частоты групп).
Процесс группировки единиц совокупности по признаку среднесписочная численность работников представлен во вспомогательной (рабочей) таблице 4.
Таблица 4
Рабочая таблица для построения статистического ряда распределения и аналитической группировки
На основе групповых итоговых строк «Итого» табл. 4 формируется итоговая таблица 5, представляющая интервальный ряд распределения предприятий по среднесписочной численности работников.
Таблица 5
Распределение предприятий по среднесписочной численности работников
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё накопленные (кумулятивные) частоты Si, получаемые путем последовательного суммирования частот всех предшествующих (i-1) интервалов.
Вывод. Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по среднесписочной численности работников не является равномерным: преобладают организации со среднесписочной численности работников от 160 до 180 чел. (это 12 организаций, доля которых составляет 40%).
1.2. Построение графиков полученного ряда распределения, графическое определение значений моды и медианы
Мода и медиана являются структурными средними величинами, характеризующими центр распределения единиц совокупности по изучаемому признаку.
Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1).
Рис. 1 Определение моды графическим методом
Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл.5, графа 4).
Рис. 2. Определение медианы графическим методом
1.3. Расчет характеристик интервального ряда распределения
Средняя арифметическая взвешенная EMBED Equation.3 – средняя сгруппированных величин:
EMBED Equation.3, (2)
EMBED Equation.3- сумма произведений величины признаков на их частоты;
EMBED Equation.3-общая численность единиц совокупности;
EMBED Equation.3 – середина i-го интервала/
Среднее квадратическое отклонеие (?) равно корню квадратному из дисперсии. Дисперсия признака (?2) представляет собой средний квадрат отклонений вариантов от их средней величины и равна разности средней из квадратов вариантов ( EMBED Equation.3 ) и квадрата их средней ( EMBED Equation.3 )
EMBED Equation.3 (3)
Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической и характеризует однородность совокупности:
EMBED Equation.3 (4)
Значение моды для интервального ряда рассчитывается по формуле:
EMBED Equation.3 (5)
хМo – нижняя граница модального интервала,
h –величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Значение медианы для интервального ряда рассчитывается по формуле:
EMBED Equation.3 (6)
где хМе– нижняя граница медианного интервала,
h – величина медианного интервала,
EMBED Equation.3– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – накопленная частота предмедианного интервала.
Для расчета медианы необходимо, определить медианный интервал, для чего используются накопленные частоты из табл. 5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот EMBED Equation.3 или превышает ее.
Медианным является интервал 160 – 180 чел.
Для расчета характеристик ряда распределения с помощью Microsoft Exel строится расчетная таблица 6 (в таблице 7 расчет представлен в режиме отображения формул).
Выводы. Анализ полученных значений показателей средней арифметической взвешенной ( EMBED Equation.3 ) и среднего квадратического отклонения (?) говорит о том, что среднесписочная численность работников составляет 173 чел., отклонение от среднего объема в ту или иную сторону составляет в среднем 21 чел. (или 12,4%).
Значение коэффициента вариации V = 12,4% не превышает 33%, следовательно, вариация среднесписочная численность работников в исследуемой совокупности организаций незначительна и совокупность по данному признаку качественно однородна.
Мода свидетельствует, что для рассматриваемой совокупности организаций наиболее распространенная величина среднесписочной численности работников характеризуется средней величиной 172 чел
Медиана показывает, что из 30 организаций 15 организаций имеют среднесписочную численность работников менее 173 чел, а 15 организаций – более.
Расхождение между значениями EMBED Equation.3 , Мо и Ме незначительно ( EMBED Equation.3 =174чел, Мо=172 чел., Ме=173 чел.), следовательно распределение близко к нормальному.
1.4. Вычисление средней арифметической по исходным данным
Для расчета применяется формула средней арифметической простой:
EMBED Equation.3 (7)
Причина расхождения средних величин, рассчитанных по формулам (2) и (7), заключается в том, что по формуле (7) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти организаций, а по формуле (2) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов xi , что приводит к погрешности.
Задание 2
По исходным данным:
Установить наличие и характер связи между признаками среднесписочная численность работников и фонд заработной платы, образовав пять групп по обоим признакам с равными интервалами, используя методы:
а) аналитической группировки;
б) корреляционной таблицы.
Измерить тесноту корреляционной связи между признаками с использованием коэффициента детерминации и эмпирического корреляционного отношения.
Сделать выводы по результатам выполнения задания .
Решение:
2.1. Установление наличия и характера связи между признаками
1а. Применение метода аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой i-ой группы ряда определяется среднегрупповое значение EMBED Equation.3 результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения EMBED Equation.3 систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную таблицу 4, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – среднесписочная численность работников и результативным признаком Y – фонд заработной платы.
Групповые средние значения EMBED Equation.3 получаем из таблицы 4 (графа 5), основываясь на итоговых строках «Всего». Построенная аналитическая группировка представлена в таблице 8 (в таблице 9 представлен режим отображения формул).
Из таблицы 8 видно, что с увеличением среднесписочой численности работников возрастает фонд заработной платы, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
1б. Применение метода корреляционной таблицы.
Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х, а графы – группировке единиц по результативному признаку Y. На пересечении i-ой строки и k-ой графы указывается число единиц совокупности, входящих в i-ый интервал по факторному признаку и в k-ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками.
Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х – среднесписочная численность работников известны. Для результативного признака Y – фонд заработной платы величина интервала определяется по формуле (1) при k = 5, уmax = 26,4 млн. руб., уmin = 4,32 млн. руб.:
EMBED Equation.3
Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 10).
Вывод. Анализ данных табл. 10 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между признаками среднесписочная численность и фонд заработной платы.
2.2. Измерение тесноты корреляционной связи
Для измерения тесноты связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации ?2 и эмпирическое корреляционное отношение ?.
Эмпирический коэффициент детерминации ?2 оценивает, насколько вариация результативного признака Y объясняется вариацией фактора Х. Показатель ?2 рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
EMBED Equation.3, (9)
где EMBED Equation.3 – общая дисперсия признака Y,
EMBED Equation.3 – межгрупповая (факторная) дисперсия признака Y.
Значения показателя ?2 изменяются в пределах 0? ?2 ?1. При отсутствии корреляционной связи между признаками Х и Y имеет место равенство ?2 =0, а при наличии функциональной связи между ними – равенство ?2 =1.
Общая дисперсия ?2 характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных).
Общая дисперсия может быть рассчитана по формуле
EMBED Equation.3,
где EMBED Equation.3 – средняя из квадратов значений результативного признака,
EMBED Equation.3 – квадрат средней величины значений результативного признака.
Межгрупповая дисперсия ?2 измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних EMBED Equation.3 от общей средней EMBED Equation.3 . Показатель ?2 вычисляется по формуле
EMBED Equation.3, (13)
где EMBED Equation.3 – групповые средние,
EMBED Equation.3 – общая средняя,
ni –число единиц в i-ой группе,
Расчет эмпирического коэффициента детерминации ?2 по формуле (9):
Эмпирическое корреляционное отношение ? оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
EMBED Equation.3 (14)
Значение показателя изменяются в пределах 0? ? ?1. Чем ближе значение ? к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе ? служит шкала Чэддока.
Для расчетов строятся вспомогательные таблицы 11,12, в таблицах 13,14 расчеты представлены в режиме отображения формул.
Вывод. Эмпирический коэффициент детерминации ?2 показывает, что 94,1% вариации среднесписочной численности работников обусловлено вариацией фонда заработной платы, а 5,9% – влиянием прочих неучтенных факторов.
Значение корреляционного отношения ? близко к 1. Согласно шкале Чэддока, связь между среднесписочной численности работников и фонда заработной платы является тесной, так как ?=0,970.
Задание 3
По результатам выполнения Задания 1 с вероятностью 0,954 определить:
ошибку выборки среднесписочной численности работников и границы, в которых будет находиться средняя в генеральной совокупности.
ошибку выборки доли организаций со среднесписочной численностью работников 100 и более человек и границы, в которых будет находиться генеральная доля.
Решение:
3.1. Определение ошибки выборки.
Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их интервалы
EMBED Equation.3
Средняя ошибка выборки в случае бесповторного отбора для средней вычисляется по формуле:
EMBED Equation.3,
s2– дисперсия выборочной совокупности;
EMBED Equation.3 ? доля выборки. Так как по условию выборка 5%-ная, то EMBED Equation.3 =0,05
Тогда предельная ошибка выборки для средней будет равна:
EMBED Equation.3
Так как по условию ошибку надо гарантировать с вероятностью 0,954, то коэффициент доверия t=2. Из расчетов задачи 1 дисперсия равна s2=?2=21,542 =463,97
EMBED Equation.3(чел.)
Тогда границы, в которых будет находиться среднесписочной численности работников: EMBED Equation.3 ; EMBED Equation.3 ; EMBED Equation.3
Вывод. На основании проведенного выборочного обследования с вероятностью 0,954 в генеральной совокупности организаций среднесписочная численность работников находится в пределах от 165,33 чел. до 180,67 чел.
3.2. Определение ошибки выборки доли организаций
Выборочная доля организаций со среднесписочной численностью работников 180 и более чел. и более равна:
EMBED Equation.3
где m – число единиц совокупности, обладающих заданным свойством;
n – общее число единиц в совокупности.
Найдем предельную ошибку выборки для доли ?? в случае бесповторного отбора:
EMBED Equation.3
где ? – доля единиц совокупности, обладающих заданным свойством;
(1-?) – доля единиц совокупности, не обладающих заданным свойством,
N – число единиц в генеральной совокупности,
n– число единиц в выборочной совокупности.
Тогда границы, в которых будет находиться генеральная доля предприятий со среднесписочной численностью работников 180 и более чел. равна:
EMBED Equation.3 ; EMBED Equation.3 ; EMBED Equation.3
Вывод. С вероятностью 0,954 можно утверждать, что в генеральной совокупности организаций доля организаций со среднесписочной численностью работников 180 и более чел., будет находиться в пределах от 35% до 38%.
Задание 4
Имеются следующие данные по двум организациям:
Определите:
1. Индексы динамики средней заработной платы по каждой организации.
Результаты расчетов представьте в таблице.
2. По двум организациям вместе:
индексы средней заработной платы переменного, постоянного состава, структурных сдвигов;
абсолютное изменение средней заработной платы в целом и за счет отдельных факторов;
абсолютное изменение фонда заработной платы вследствие изменения среднесписочной численности работников, средней заработной платы и двух факторов вместе.
Сделайте выводы.
Решение:
Расчеты представлены в таблице 15.
Таблица 15
Индекс переменного состава будет равен
EMBED Equation.3
Таким образом, по двум предприятиям средняя заработная плата увеличилась на 36,1%, в то время как увеличение средней заработной платы по первому предприятию 30%, а по второму 42,9%.
Причина такого расхождения кроется в сущности индекса. Индекс переменного состава характеризует изменение средней заработной платы ( EMBED Equation.3 ). На величине средней каждого периода отражается не только изменение средней заработной платы, но и изменение удельного веса каждого предприятия в общем фонде оплаты труда. Следовательно, на индексе переменного состава сказывается влияние сразу двух факторов. Для того, чтобы выявить влияние каждого фактора в отдельности на величину индекса переменного состава, следует рассчитать еще 2 индекса: индекс постоянного (фиксированного) состава и индекс структурных сдвигов.
Индекс постоянного (фиксированного) состава - это тоже отношение двух средних средней заработной платы, но при условии неизменной структуры (удельного веса предприятий в общем фонде оплаты труда).
EMBED Equation.3 или 36,5%.
Этот индекс учитывает изменение только самой средней заработной платы; без перераспределения работников по предприятиям: она увеличилась бы на 36,5%.
Для выявления влияния структурных сдвигов рассчитываем индекс структурных сдвигов. Это тоже отношение двух средних уровней средней заработной платы, но в них исключено влияние средней заработной платы:
EMBED Equation.3 или 99,7%.
Следовательно, в результате перераспределения в числе работников по предприятиям, а именно, уменьшения их количества на втором предприятии с более высокой средней заработной платой и увеличения на первом, где средняя заработная плата меньше, произошло незначительное снижение уровня средней заработной платы на 0,3%. EMBED Equation.3
Взаимосвязь этих индексов: EMBED Equation.3 . В приведенном примере 1,361=1,365*0,997.
В абсолютных величинах:
EMBED Equation.3 руб.
На 1927,5 руб. увеличивается средняя заработная плата под влиянием самой индексируемой величины ( т.е. средней зар.платы ).
EMBED Equation.3 руб.
На 15 руб. уменьшается средняя заработная плата за счет изменения среднесписочной численности.
EMBED Equation.3 руб.
На 1912,5руб. уменьшается средняя заработная плата под влиянием двух вышеназванных факторов
Взаимосвязь и разложение абсолютного прироста по факторам
EMBED Equation.3 т.е, 1927,5-15=1912,5
Список использованной литературы;
Гусаров В.М. Статистика: Учеб пособие для вузов. — М.: ЮНИТИ-ДАНА, 2004. – 463 с.
Практикум по статистике: Учеб. пособие для вузов/ Под ред. В.М. Симчеры / ФЗФЭИ. — М.: ЗАО «Финстатинформ», 1999. – 259 с.
Статистика. Методические рекомендации к выполнению статистических расчётов курсовых, контрольных и выпускных квалификационных работ. Часть I. Комплексное использование методов при проведении статистического анализа данных. Для студентов всех специальностей (первое и второе высшее образование).– М.:ВЗФЭИ, 2007.– 41с.