Теоретическая часть
1 Предмет и метод статистики
Свой предмет статистика изучает методом обобщающих показателей. Она анализирует также природные ресурсы и природные условия, поскольку они влияют на жизнь общества.
Теоретической основой статистики являются положения социально-экономической теории, которые рассматривают законы развития социально-экономических явлений, выясняют их природу и значение в жизни общества. Статистика — отрасль общественной науки, изучающая методом обобщающих показателей количественную сторону качественно определенных массовых социально-экономических явлений и закономерностей их развития в конкретных условиях места и времени.
Для изучения предмета статистики разработаны и применяются специфические приемы, совокупность которых образует методологию статистики (методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод и др.) Применение в статистике конкретных методов предопределяется поставленными задачами и зависит от характера исходной информации.
Статистика опирается на такие диалектические категории, как количество и качество, необходимость и случайность, причинность, закономерность, единичное и массовое, индивидуальное и общее.
Статистические методы используются комплексно (системно). Это обусловлено сложностью процесса экономико-статистического исследования, состоящего из трех основных стадий:
первая — сбор первичной статистической информации;
вторая — статистическая сводка и обработка первичной информации;
третья — обобщение и интерпретация статистической информации.
На третьей стадии проводится анализ статистической информации на основе применения обобщающих статистических показателей: абсолютных, относительных и средних величин, вариации, тесноты связи и скорости изменения социально-экономических явлений во времени, индексов и др. Проведение анализа позволяет проверить причинно-следственные связи изучаемых явлений и процессов, определить влияние и взаимодействие различных факторов, оценить эффективность принимаемых управленческих решений, возможные экономические и социальные последствия складывающихся ситуаций.
При изучении статистической информации широкое применение имеют табличный и графические методы.
1.2 Выборочный метод в статистике
Статистическое наблюдение можно организовать сплошное и не сплошное. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности и связано с большими трудовыми и материальными затратами. Изучение не всех единиц совокупности, а лишь некоторой части, по которой следует судить о свойствах всей совокупности в целом, можно осуществить не сплошным наблюдением. В статистической практике самым распространенным является выборочное наблюдение.
Выборочное наблюдение — это такое не сплошное наблюдение, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исходную совокупность. Наблюдение организуется таким образом, что эта:, часть отобранных единиц в уменьшенном масштабе репрезентирует (представляет) всю совокупность.
Выборочный метод обладает следующими достоинствами:
- относительно небольшие материальные, трудовые и стоимостные затраты на сбор данных;
- оперативность получения результатов;
- широкая область применения;
- высокая достоверность результатов.
Все эти достоинства проявляются лишь при условии правильного решения проблем выборочного обследования. К ним относится:
Определение границ генеральной совокупности;
Разработка программы наблюдения и инструкций;
Определение основы для проведения выборки – списка единицы генеральной совокупности, сведений об их размещении и т. д.;
Установление допустимого размера погрешности и определения объема выборки;
Определение вида выборочного наблюдения;
Установление сроков проведения наблюдения;
Определение потребности в кадрах для проведения выборочного наблюдения, их подготовка;
Оценка точности и достоверности данных выборки, определение порядка их распространения на генеральную совокупность.
Совокупность, из которой производится отбор, называется генеральной, и все ее обобщающие показатели — генеральными.
Совокупность отобранных единиц именуют выборочной совокупностью, и все ее обобщающие показатели — выборочными.
Основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических исследованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.
Ошибки регистрации могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. Случайные ошибки обычно уравновешивают друг друга, поскольку не имеют преимущественного направления в сторону преувеличения или преуменьшения значения изучаемого показателя. Систематические ошибки направлены в одну сторону вследствие преднамеренного нарушения правил отбора (предвзятые цели). Их можно избежать при правильной организации и проведении наблюдения.
Ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном с одинаковой степенью точности сплошном наблюдении, т.е. между величинами выборных и соответствующих генеральных показателей.
Для каждого конкретного выборочного наблюдения значение ошибки репрезентативности может быть определено по соответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности.
По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности; при групповом отборе — качественно однородные группы или серии изучаемых единиц; комбинированный отбор предполагает сочетание первого и второго видов.
По методу отбора различают повторную и бесповторную выборки.
При повторной выборке общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку ("отбор по схеме возвращенного шара"). Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме бесповторной выборки.
При бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т.е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц ("отбор по схеме невозвращенного шара"). Таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе исследования.
Способом отбора определяется конкретный механизм или процедура выборки единиц из генеральной совокупности.
По степени охвата единиц совокупности различают большие и малые (n<30) выборки.
В практике выборочных исследований наибольшее распространение получили следующие виды выборки: собственно -случайная, механическая, типическая, серийная, комбинированная.
Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами:
N – объем генеральной совокупности (число входящих в нее единиц);
n – объем выборки (число обследованных единиц);
EMBED Equation.3 – генеральная средняя (среднее значение признака в генеральной совокупности);
EMBED Equation.3 – выборочная средняя;
P – генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности);
w – выборочная доля;
EMBED Equation.3 – генеральная дисперсия (дисперсия признака в генеральной совокупности);
S2 – выборочная дисперсия того же признака;
EMBED Equation.3 – среднее квадратическое отклонение в генеральной в совокупности;
S – среднее квадратическое отклонение в выборке.
Ошибки выборки
При выборочном наблюдении должна быть обеспечена случайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом основывается собственно-случайная выборка.
К собственно-случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного расчленения ее на какие-либо группы) посредством жеребьевки (преимущественно) или какого-либо иного подобного способа, например, с помощью таблицы случайных чисел. Случайный отбор — это отбор не беспорядочный. Принцип случайности предполагает, что на включение или исключение объекта из выборки не может повлиять какой-либо фактор, кроме случая.
Определение способа отбора и процедуры выборки, вычисление ошибок выборки и построение доверительных интервалов выборочных характеристик, расчет необходимого объема выборки.
Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентативность (представительность) выборочной совокупности. Различают среднюю и предельную ошибки выборки.
Эти два вида ошибок связаны следующим соотношением:
EMBED Equation.3 , (1.1)
где ? – предельная ошибка;
t – коэффициент доверия, определяемый в зависимости от уровня вероятности;
µ - средняя ошибка выборки.
Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Так, при случайном повторном отборе средняя ошибка определяется по формуле при повторной выборки:
EMBED Equation.3 , (1.2)
При бесповторном:
EMBED Equation.3 , (1.3)
где EMBED Equation.3 - выборочная (или генеральная) дисперсия;
EMBED Equation.3 - выборочная (или генеральная) среднее квадратное отклонение;
n – объем выборочной совокупности;
N – объем генеральной совокупности.
Расчет средней и предельной ошибки выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:
EMBED Equation.3 , (1.4)
где EMBED Equation.3 и EMBED Equation.3 - генеральная и выборочная средние соответственно;
EMBED Equation.3 - предельная ошибка выборочной средней.
Пример:
В городе проживают 250 тыс. семей. Для определения среднего числа детей в семье было организована 2%-ная, случайная, бесповторная выборка семей. По ее результату было получено следующее распределение семей по числу детей (таблица 1):
Таблица 1.1
Распределение семей по числу детей
С вероятностью 0,954 найдите пределы, в которых будут находиться среднее число детей в генеральной совокупности?
Решение:
Вначале на основе имеющегося распределения семей определим выборочную среднюю и дисперсию:
EMBED Equation.3 ;
EMBED Equation.3 .
Вычислим предельную ошибку выборки (с учетом того, что EMBED Equation.3 ).
Наряду с определением ошибок выборки и пределов для генеральной средней эти же показатели могут быть определены для доли признака. В этом случае особенности расчета связаны с определением дисперсии доли, которая вычисляется по формуле:
EMBED Equation.3 , (1.5)
где EMBED Equation.3 - доля единиц, обладающих данным признаком в выборочной совокупности, определяемая как отношение количества соответствующих единиц к объему выборки.
Тогда, например, при собственно-случайном повторном отборе для определения предельной ошибки выборки используется формула:
EMBED Equation.3 , (1.6)
Соответственно при бесповторном отборе:
EMBED Equation.3 , (1.7)
Пределы доли признака в генеральной совокупности EMBED Equation.3 выглядят следующим образом:
EMBED Equation.3 . (1.8)
Ошибки и пределы генеральных характеристик при других способах формирования выборочной совокупности определяются на основе соответствующих формул, отражающих особенности этих видов выборки. Например, в случае типической выборки показателем вариации является средняя из внутригрупповых дисперсий EMBED Equation.3 , при серийной выборке – межгрупповая дисперсия EMBED Equation.3 и т. д. Кроме, того в последнем случае вместо объема выборочной совокупности n используется показатель числа серий r.
Следовательно, для типической выборки средняя ошибка вычисляется по формуле:
- при отборе, пропорциональном объему типических групп:
EMBED Equation.3 (повторный отбор); (1.9)
EMBED Equation.3 (бесповторный отбор). (1.10)
- при отборе, пропорциональном вариации признака (не пропорциональных объем групп):
EMBED Equation.3 (повторный отбор); (1.11)
EMBED Equation.3 (бесповторный отбор), (1.12)
где Ni и ni – объем i-ой типической группы и выборки из нее соответственно;
EMBED Equation.3 - групповые дисперсии.
При серийной выборки средняя ошибка определяется следующим образом:
EMBED Equation.3 (повторный отбор); (1.13)
EMBED Equation.3 (бесповторный отбор), (1.14)
где R – число серий в генеральной совокупности;
EMBED Equation.3 - межгрупповая (межсерийная) дисперсия; (1.15)
r – число серий в выборочной совокупности.
Формулы необходимого объема выборки для различных способов формирования выборочной совокупности могут быть выведены из соответствующих соотношений, используемых при расчете предельных ошибок выборки.
Приведем наиболее часто применяемые на практике выражения необходимого объема выборки:
- собственно – случайная и механическая выборка:
EMBED Equation.3 (повторный отбор); (1.16)
EMBED Equation.3 (бесповторный отбор). (1.17)
- типическая выборка:
EMBED Equation.3 (повторный отбор); (1.18)
EMBED Equation.3 (бесповторный отбор). (1.19)
- серийная выборка:
EMBED Equation.3 (повторный отбор); (1.20)
EMBED Equation.3 (бесповторный отбор). (1.21)
При этом в зависимости от целей исследования дисперсии и ошибки выборки могут быть рассчитаны для средней величины или доли признака.
Расчетная часть
ТЕМА: Выборочный метод изучения производственных и финансовых показателей.
Имеются следующие выборочные данные по предприятиям одной из отраслей промышленности региона в отчетном году (выборка 20%-ная механическая), млн.руб. (таблица 1.1):
Таблица 2.1
Исходные данные
Задание 1
Исследование структуры совокупности по исходным данным:
Построить статистический ряд распределения организации по признаку уровня рентабельности продукции, образовав заданное число групп (по условию пять) с равными интервалами.
Построить графики полученного ряда распределения. Графически определить моду и медиану.
Рассчитать характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.
Вычислить среднюю арифметическую по исходным данным, для интервального ряда распределения. Объяснить причину расхождения.
Сделать выводы по результатам выполнения задания.
Решение: Уровень рентабельности рассчитывается путем деления прибыли от продаж, т.е. разности между выручкой от продаж продукции и затратами на ее производство и реализацию, на затраты на производство и реализацию продукции.
Пусть:
Уровень рентабельности продукции – Z;
Прибыль от продаж – К;
Выручка от продаж продукции – Х;
Затраты на производство и реализацию продукции – У.
Следовательно: прибыль от продаж рассчитывается по формуле (2.1):
К = Х – У (2.1)
уровень рентабельности продукции рассчитаем по формуле (2.2):
EMBED Equation.3 . (2.2)
Расчеты для построения статистического ряда распределения организации представлены в таблице 2.2.
Таблица 2.2
Расчеты для построения статистического ряда распределения организации по уровню рентабельности
1. Построение интервального ряда распределения организаций по уровню рентабельности продукции
Для построения интервального вариационного ряда, характеризующего распределение организаций по уровню рентабельности, необходимо вычислить величину и границы интервалов ряда.
При построении ряда с равными интервалами величина интервала h определяется по формуле (2.3):
EMBED Equation.3 , (2.3)
где EMBED Equation.3 – наибольшее и наименьшее значения признака в исследуемой совокупности, k- число групп интервального ряда.
Число групп k задается в условии задания или рассчитывается по формуле Г. Стерджесса
k=1+3,322lg n, (2.4)
где n - число единиц совокупности.
Определение величины интервала по формуле (2.3) при заданных k = 5, xmax = 0,29871 млн руб., xmin = 0,14943 млн руб.:
EMBED Equation.3
При h = 0,02986 млн. руб. границы интервалов ряда распределения имеют следующий вид (табл. 2.3):
Таблица 2.3
Нижние и верхние границы группы
Для построения интервального ряда необходимо подсчитать число предприятий, входящих в каждую группу (частоты групп). При этом возникает вопрос, в какую группу включать единицы совокупности, у которых значения признака выступают одновременно и верхней, и нижней границами смежных интервалов (для демонстрационного примера – это 0,17928; 0,20914; 0,23900; 0,26885 млн. руб.). Отнесение таких единиц к одной из двух смежных групп рекомендуется осуществлять по принципу полуоткрытого интервала. Т.к. при этом верхние границы интервалов не принадлежат данным интервалам, то соответствующие им единицы совокупности включаются не в данную группу, а в следующую. В последний интервал включаются и нижняя, и верхняя границы.
Процесс группировки единиц совокупности по признаку уровня рентабельности продукции представлен во вспомогательной (разработочной) таблице 2.4 (графы 3, 4 этой таблицы необходима для построения аналитической группировки в Задании 2).
Таблица 2.4
Разработочная таблица для построения интервального ряда распределения и аналитической группировки
На основе групповых итоговых строк «Всего» табл. 2.4 формируется итоговая таблица 2.5, представляющая интервальный ряд распределения организаций по уровню рентабельности продукции.
Таблица 2.5
Распределение организаций по уровню рентабельности продукции
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё четыре характеристики ряда, приведенные в графе 5 табл. 2.6. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле (2.5):
EMBED Equation.3 (2.5)
Таблица 2.6
Структура организаций по уровню рентабельности продукции
Вывод. Анализ интервального ряда распределения изучаемой совокупности организаций показывает, что распределение организаций по уровню рентабельности продукций не является равномерным: преобладают организации с уровнем рентабельности от 0,20914 млн. руб. до 0,23900 млн. руб. (это 9 предприятий, доля которых составляет 30%); 26,7% организаций имеют уровень рентабельности менее 0,20914 млн. руб., а 20% – более 0,23900 млн. руб.
2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности . В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1).
Рис. 1 Определение моды графическим методом
Конкретное значение моды для интервального ряда рассчитывается по формуле (2.6):
EMBED Equation.3 (2.6)
где хМo – нижняя граница модального интервала,
h –величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл.4 модальным интервалом построенного ряда является интервал 0,20914– 0,23900 млн. руб., так как его частота максимальна (f3 = 9).
Расчет моды по формуле (2.6):
EMBED Equation.3
Вывод. Для рассматриваемой совокупности организации наиболее распространенная уровень рентабельности продукции характеризуется средней величиной 0,2166 млн. руб.
Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 2.6, графа 5).
Рис. 2. Определение медианы графическим методом
Конкретное значение медианы для интервального ряда рассчитывается по формуле (2.7):
EMBED Equation.3, (2.7)
где хМе– нижняя граница медианного интервала,
h – величина медианного интервала,
EMBED Equation.3– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 2.5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот EMBED Equation.3 или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).
В демонстрационном примере медианным интервалом является интервал 0,23900 – 0,26885 млн. руб., так как именно в этом интервале накопленная частота Sj = 27 впервые превышает величину, равную половине численности единиц совокупности ( EMBED Equation.3 = EMBED Equation.3 ).
Расчет значения медианы по формуле (2.7):
EMBED Equation.3
Вывод. В рассматриваемой совокупности организаций половина предприятий имеют в среднем уровень рентабельности продукции не более 0,2191 млн. руб., а другая половина – не менее 0,2191 млн. руб.
3. Расчет характеристик ряда распределения
Для расчета характеристик ряда распределения EMBED Equation.3 , ?, ?2, V? на основе табл. 2.6 строится вспомогательная таблица 2.7 ( EMBED Equation.3 – середина j-го интервала).
Таблица 2.7
Расчетная таблица для нахождения характеристик ряда распределения
Расчет средней арифметической взвешенной:
EMBED Equation.3 (2.8)
Расчет среднего квадратического отклонения:
EMBED Equation.3 (2.9)
Расчет дисперсии:
?2 =0,215602 = 0,04648
Расчет коэффициента вариации:
EMBED Equation.3 (2.10)
Вывод. Анализ полученных значений показателей EMBED Equation.3 и ? говорит о том, что средний уровень рентабельности продукции по предприятиям составляет 0,22009 млн. руб., отклонение от среднего объема в ту или иную сторону составляет в среднем 154,127 млн. руб. (или 97,96%).
Значение V? = 97,96% на много превышает 33%, следовательно, вариация уровня рентабельности продукции в исследуемой совокупности организаций значительна и совокупность по данному признаку качественно неоднородна. Расхождение между значениями EMBED Equation.3 , Мо и Ме значительны ( EMBED Equation.3 =0,22009 млн. руб., Мо=0,2166 млн. руб., Ме=0,2191 млн. руб.), что подтверждает вывод об неоднородности совокупности организаций. Таким образом, найденное среднее значение уровня рентабельности продукции (0,22009 млн. руб.) является нетипичной, ненадежной характеристикой исследуемой совокупности организаций.
4.Вычисление средней арифметической по исходным данным
Для расчета применяется формула средней арифметической простой:
EMBED Equation.3 (2.11)
Причина расхождения средних величин, рассчитанных по формулам (2.11) и (2.8), заключается в том, что по формуле (2.11) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти предприятий, а по формуле (2.8) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов хср и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).
Задание 2
По исходным данным табл. 2.1 с использованием результатов выполнения Задания 1 необходимо выполнить следующее:
Установить наличие и характер корреляционной связи между признаками Затраты на производство и реализацию продукции и Уровень рентабельности продукции, образовав по каждому признаку пять групп с равными интервалами, используя методы:
а) аналитической группировки;
б) корреляционной таблицы.
Выполнение Задания 2
Целью выполнения данного Задания является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи и оценка ее тесноты.
Факторный и результативный признаки либо задаются в условии задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.
По условию Задания 2 факторным является признак Затраты на производство и реализацию продукции (X), результативным – признак Уровень рентабельности продукции (Y).
1. Установление наличия и характера связи между знаками, методами аналитической группировки и корреляционной таблицы
1а. Применение метода аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение EMBED Equation.3 результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения EMBED Equation.3 систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Уровень рентабельности продукции и результативным признаком Y – Затраты на производство и реализацию продукции.
Групповые средние значения EMBED Equation.3 получаем из таблицы 2.4 (графа 3), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 2.8.
Таблица 2.8
Зависимость уровня рентабельности продукции от затрат на производство и реализацию продукции, млн. руб.
Вывод. Анализ данных табл. 2.8 показывает, что с увеличением затрат на производство и реализацию продукции от группы к группе систематически возрастает и уровень рентабельности производства по каждой группеорганизаций, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
1б. Применение метода корреляционной таблицы.
Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х, а графы – группировке единиц по результативному признаку Y. На пересечении j-ой строки и k-ой графы указывается число единиц совокупности, входящих в j-ый интервал по факторному признаку и в k-ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему. Расположение частот по диагонали от правого верхнего угла к левому нижнему говорит об обратной связи.
Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х – уровень рентабельности известны из табл. 8. Для результативного признака Y – Затраты на производство и реализацию продукции величина интервала определяется по формуле (2.3) при
k = 5,
уmax = 60,984 млн руб., уmin = 12,528 млн руб.:
EMBED Equation.3
Границы интервалов ряда распределения результативного признака Y имеют следующий вид (табл. 2.9):
Таблица 2.9
Нижние и верхние границы группы
Подсчитывая с использованием принципа полуоткрытого интервала: число предприятий, входящих в каждую группу (частоты групп), получаем интервальный ряд распределения результативного признака (табл. 2.10).
Таблица 2.10
Распределение предприятий по затратам на производство
и реализацию продукции
Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 2.11).
Таблица 2.11
Корреляционная таблица зависимости уровня рентабельности и затратами на производство и реализацию продукции
Вывод. Анализ данных табл. 2.11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между затратами на производство и реализацию продукции и уровнем рентабельности.
Задание 3
По результатам выполнения Задания 1 с вероятностью 0,997 необходимо определить:
1. Ошибку выборки среднего уровня рентабельности организации и границы, в которых будет находиться средний уровень рентабельности в генеральной совокупности;
2. Ошибку выборки доли организации с уровнем рентабельности продукции 23,9% и более и границы, в которых будет находиться генеральная доля.
Выполнение Задания 3
Целью выполнения данного Задания является определение для генеральной совокупности организаций региона границ, в которых будут находиться величина среднего уровня рентабельности продукции и доля организаций с уровнем рентабельности продукции 23,9%.
1. Определение ошибки выборки среднего уровня рентабельности организации и границы, в которых будет находиться средний уровень рентабельности в генеральной совокупности
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ?, которую называют ошибкой выборки (ошибкой репрезентативности).
Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю EMBED Equation.3 и предельную EMBED Equation.3 .
Средняя ошибка выборки EMBED Equation.3 - это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[ EMBED Equation.3 ].
Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.
Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка EMBED Equation.3 выборочной средней EMBED Equation.3 определяется по формуле (1.3)
Предельная ошибка выборки EMBED Equation.3 определяет границы, в пределах которых будет находиться генеральная средняя (формула 1.4):
Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.
В экономических исследованиях чаще всего используются доверительные вероятности Р= 0,954; Р= 0,997; реже Р= 0,683.
В математической статистике доказано, что предельная ошибка выборки ? кратна средней ошибке µ с коэффициентом кратности t (называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней EMBED Equation.3 это теоретическое положение выражается формулой ():
EMBED Equation.3 (1.6)
Значения t вычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл. 3.1):
Таблица 3.1
По условию демонстрационного примера выборочная совокупность насчитывает 30 организаций, выборка 20% механическая, следовательно, генеральная совокупность включает 150 организаций. Выборочная средняя EMBED Equation.3 , дисперсия EMBED Equation.3 определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 3.2:
Таблица 3.2
Расчет средней ошибки выборки по формуле (1.3):
EMBED Equation.3 ,
Расчет предельной ошибки выборки по формуле (1.6):
EMBED Equation.3
Определение по формуле (1.4) доверительного интервала для генеральной средней:
0,22009-0,05281 EMBED Equation.3 0,22009+0,05281,
0,16728 млн. руб. EMBED Equation.3 0,27290 млн. руб.
Вывод. На основании проведенного выборочного исследования организаций с вероятностью 0,997 можно утверждать, что для генеральной совокупности организаций среднего уровня рентабельности продукции находится в пределах от 0,16728 млн. руб. до 0,27290 млн. руб.
2. Ошибку выборки доли организации с уровнем рентабельности продукции 23,9% и более и границы, в которых будет находиться генеральная доля.
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой (3.1):
EMBED Equation.3 , (3.1)
где m – число единиц совокупности, обладающих заданным свойством;
n – общее число единиц в совокупности.
Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки EMBED Equation.3 доли единиц, обладающих заданным свойством, рассчитывается по формуле (1.7)
Предельная ошибка выборки EMBED Equation.3 определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих заданным свойством:
EMBED Equation.3 (3.2)
По условию Задания 3 исследуемым свойством является равенство или превышение уровня рентабельности продукции величины 0,27290 млн. руб.
Число организаций с заданным свойством определяется из табл. 2.4 (графа 3): m=3
Расчет выборочной доли по формуле (3.1):
EMBED Equation.3
Расчет по формуле (1.7) предельной ошибки выборки для доли:
EMBED Equation.3
Определение по формуле (3.2) доверительного интервала генеральной доли:
EMBED Equation.3
- 0,04697 EMBED Equation.3 0,24697
или
- 4,697% EMBED Equation.3 24,697%
Вывод. С вероятностью 0,997 можно утверждать, что в генеральной совокупности организаций доля организаций с уровнем рентабельности продукции 23,9% и выше будет находиться в пределах от – 4,697% до 24,697%.
Задание 4
Использование индексного метода в финансово-экономической задачи.
Выпуск продукции и удельный расход стали по региону, в текущем периоде характеризуется следующими данными (таблица 4.1):
Таблица 4.1
Выпуск продукции и удельный расход стали по региону, в текущем периоде
Определить:
Индивидуальные индексы выполнения норм расхода стали.
Общий индекс выполнения норм расхода стали на весь выпуск продукции.
Абсолютную экономию (перерасход) стали.
Выполнение Задания 4
1. Определим индивидуальный индекса выполнения норм расхода стали по формуле (4.1):
ip=p1/p2 (4.1)
В этом случае получаем таблицу 4.2:
Таблица 4.2
Определение индивидуального индекса выполнения норм расхода стали
Вывод: Из определение индивидуального индекса выполнения норм расхода стали видно, что для выпуска продукции А было расходовано больше на 5,6% чем по норме, для выпуска продукции Б стали было расходовано меньше, чем должно быть по норме на 20% и для продукции В также меньше на 10%.
2. Для определения общего индекса нужно найти расход стали на фактический выпуск продукции по каждой продукции таблица 4.3:
Таблица 4.3
Определение общего индекса выполнения норм расхода стали на весь выпуск продукции
Общий индекс выполнения норм расхода стали на весь выпуск продукции рассчитаем по формуле (4.2):
Iq= ?p1q/?p0q (4.2)
Следовательно получаем: Iq=57230/19270=2,97
Вывод: Расход стали фактически по региону в текущем периоде возрос на 197%.
Абсолютную экономию (перерасход) стали.
Абсолютная экономия продукции Б - 20% и продукции В - 10%, а продукция А – 5,6% перерасход стали.