Лекции
1. Общее понятие статистики. Предмет статистики.
Статистикой называют планомерный и систематический учет осуществляемый в масштабах страны органами государственной статистики во главе с государственным комитетом РФ по статистике.
Статистика - цифровые данные публикуемые в специальных справочниках и средствах массовой информации.
Статистика - специальная научная дисциплина.
Предмет и содержание статистической науки.
Предмет и содержание статистической науки долгое время были дискуссионными. С целью решения этих вопросов в 1954 и 1968 гг. проводились специальные совещания с привлечением широкого круга ученых и практиков не только статистиков, но и специалистов связанных с ней науки. Кроме того, до середины 70-х гг. шла дискуссия о предмете статистики в специальной литературе. В ходе дискуссий выявились 3 основные точки зрения на предмет статистики:
1. Статистика - универсальная наука, изучающая массовое явление природы и общества.
2. Статистика - методологическая наука не имеющая своего предмета познания, а представляющая собой учение о методе, применяемым общественными науками.
3. Статистика - общественная наука, имеющая свой предмет, методологию и исследующая количественные закономерности общественного развития.
В результате проводившихся совещаний и дискуссий в статистической науке первые две точки зрения были большинством ученых и практиков отвергнуты, а третья в основном принята, дополнена и уточнена.
Предметом статистики является количественная сторона массовых социально-экономических явлений, неразрывные связи с их качественной стороной, конкретных условий, места и времени. Из данного определения следуют основные черты предмета статистической науки:
1. Статистика - наука общественная.
2. В отличие от других общественных наук статистика изучает количественную сторону общественных явлений.
3. Статистика изучает массовое явление.
4. Статистика изучает количественную сторону явлений в неразрывной связи с количественной стороной и это находит свое воплощение в существовании системы статистических показателей.
5. Статистика изучает количественную сторону явлений в конкретных условиях места и времени.
2. Метод статистики и статистическая методология.
Под статистической методологией понимается система принципов и методов их реализации направленных на изучение количественных закономерностей, проявляющихся в структуре взаимосвязей и динамике социально-экономических явлений. Важнейшими составными элементами метода статистики и статистической методологии являются массовое статистическое наблюдение, сводка и группировка, а также применение обобщающих статистических показателей и их анализ.
Сущность первого элемента статистической методологии составляет сбор первичных данных об изучаемом объекте. Например: в процессе переписи населения страны собираются данные о каждом человеке, проживающем на ее территории, которая заносится в специальный формуляр.
Второй элемент: сводка и группировка представляет собой разделение совокупности данных, полученных на этапе наблюдения на однородные группы по одному или несколько признаков. Например в результате группировки материалов переписи населения делится на группы (по полу, возрасту, населению, образованию и т.д.).
Сущность третьего элемента статистической методологии заключается в вычислении и социально-экономической интерпретации обобщающих статистических показателей:
1. Абсолютных
2. Относительных
3. Средних
4. Показателей вариации
5. Динамики
6. Индексов и т.д.
Три основных элемента статистической методологии составляют также три стадии любого статистического исследования.
3. Закон больших чисел и статистическая закономерность.
Важное значение для статистической методологии играет закон больших чисел. В наиболее общем виде он может быть сформулирован следующим образом:
Закон больших чисел - общий принцип в силу которого совокупные действия большого числа случайных факторов приводит при некоторых общих условиях к результату почти независящему от случая.
Закон больших чисел порожден особыми свойствами массовых явлений. Массовые явления последние в свою очередь с одной стороны в силу своей индивидуальности отличаются друг от друга, а с другой имеет нечто общее определяющее их принадлежность к определенному классу.
Единичное явление в большей степени подвержено влиянию случайных и несущественных факторов, чем масса явлений в целом. При определенных условиях значение признака у отдельной единицы можно рассматривать как случайную величину, учитывая, что она подчиняется не только общей закономерности, но и формируется под воздействием условий не зависящих от этой закономерности. Именно по этой причине статистика широко использует средние показатели, одним числом характеризующие всю совокупность. Только при большом числе наблюдений случайные отклонения от основного направления развития уравновешиваются, взаимопогашаются и статистическая закономерность проявляется более отчетливо. Таким образом, сущность закона больших чисел заключается в том, что в числах обобщающих результат массового статистического наблюдения закономерность развития социально-экономических явлений выявляется более отчетливо чем при небольшом по объему статистическому исследованию.
4. Отрасли статистики.
В процессе исторического развития в составе статистики как единой науки выделились и получили известную самостоятельность следующие отрасли:
1. Общая теория статистики, которая разрабатывает понятие категорий и методы измерения количественных закономерностей общественной жизни.
2. Экономическая статистика изучающая количественные закономерности процессов воспроизводства на различных уровнях.
3. Социальная статистика, изучающая количественную сторону развития социальной инфраструктуры общества (статистика здравоохранения, образования, культуры, моральная, судебная и др.).
4. Отраслевые статистики (статистика промышленности, агропромышленного комплекса, транспорта, связи и т.д.).
Все отрасли статистики, развивая и совершенствую свою методологию способствуют развитию статистической науки в целом.
5. Основные понятия и категории статистической науки в целом.
К основным понятиям и категориям статистической науки относятся следующие: совокупность, признак, показатель, система показателей и др.
Статистическая совокупность - множество элементов одного и того же вида сходных между собой по одним признакам и различающимся по другим. Например: это совокупность отраслей экономики, совокупность ВУЗ, совокупность сотрудничества КБ и т.п.
Отдельные элементы статистической совокупности называются ее единицами. В рассмотренных выше примерах единицами совокупности являются соответственно отрасли, ВУЗ (один) и сотрудник.
Единицы совокупности обладают как правило многими признаками.
Признак - свойство единиц совокупности, выражающее их сущность и имеющее способность варьировать, т.е. изменяться. Признаки, принимающие единичное значение у отдельных единиц совокупности называются варьирующими, а сами значения вариантами.
Варьирующие признаки подразделяются на атрибутивные или качественные. Признак называется атрибутивным или качественным, если его отдельное значение (варианты) выражаются в виде состояния или свойств присущих явлению. Варианты атрибутивных признаков выражаются в словесной форме. Примерами таких признаков могут служить - хозяйственный.
Признак называется количественным, если его отдельное значение выражается в виде чисел. Например: заработная плата, стипендия, возраст, размер ОФ.
По характеру варьирования количественные признаки делятся на дискретные и непрерывные.
Дискретные - такие количественные признаки, которые могут принимать только вполне определенное, как правило целое значение.
Непрерывными - являются такие признаки, которые в определенных пределах могут принимать значение как целое, так и дробное. Например: ВНП страны и т.д.
Различаются также признаки основные и второстепенные.
Основные признаки характеризуют главное содержание и сущность изучаемого явления или процесса.
Второстепенные признаки дают дополнительную информацию и непосредственно связаны с внутренним содержанием явления.
В зависимости от целей конкретного исследования одни и те же признаки в одних и тех же случаях могут быть основными, а в других второстепенными.
Статистический показатель - это категория отображающая размеры и количественные соотношения признаков социально-экономических явлений и их качественной определенности в конкретных условиях места и времени. Следует различать содержание статистического показателя и его конкретное числовое выражение. Содержание, т.е. качественная определенность состоит в том, что показатели всегда характеризуют социально-экономические категории (население, экономика, финансовые институты и т.д.). Количественные размеры статистических показателей, т.е. их числовые значения зависят прежде всего от времени и места объекта, который подвергается статистическому исследованию.
Социально-экономические явления как правило не могут быть охарактеризованы каким-либо одним показателем, Например: уровнем жизни населения. Для комплексной всесторонней характеристики исследуемых явлений необходима научно обоснованная система статистических показателей. Такая система не является постоянной. Она постоянно совершенствуется исходя из потребностей общественного развития.
6. Задачи статистической науки и практики в условиях развития рыночной экономики.
Основными задачами статистики в условиях развития в России рыночных отношений являются следующие:
1. Совершенствование учета и отчетности и сокращение на этой основе документооборота.
2. Усиление работы по контролю за достоверностью статистической информации, предоставляемой предприятиям, учреждениям и организациям всех отраслей экономики и форм собственности.
3. Повышение своевременности статистической информации как в поступающий статистический орган, так и предоставляемые ими структуры государственной власти и управления.
4. Углубление аналитических функций, разрабатываемых статистических данных, формирование тематики проводимых статистических в соответствии с текущими задачами социально-экономическом развитии страны.
5. Дальнейшее развитие и совершенствование статистической методологии на основе все более широкого внедрения ПЭВМ практика и ... статистического анализа не прогнозировалась.
1.
Статистическая сводка - метод научной обработки статистических данных собранных в процессе наблюдения, при котором информация относящаяся к отдельной единице обобщается, а затем характеризуется аналитическими показателями и системой таблиц. При сводке получаются статистические данные характеризующие всю совокупность. На данном этапе осуществляется переход от индивидуальных характеристике единиц совокупности и обобщающим показателем, характеризующим всю совокупность.
Различают сводку в узком и широком смысле слова. В узком смысле слова под сводкой понимается техническая операция по подсчету итогов. В широком смысле слова сводка состоит из группировки полученной в процессе наблюдения информации составления систем показателей для характеристики типических групп изложения этих показателей в таблицах, а также подсчета общих и групповых итогов.
2.1. Общее понятие группировок.
Группировки являются таки методом исследований социально-экономических явлений, при котором статистическая совокупность делится на однородные группы, которые раскрывают состояние и развитие всей совокупности.
Группировка является важнейшим этапом статистического исследования, соединяющим сбор первичной информации об объеме исследования и анализ этой информации на основе обобщающих статистических показателей.
Методы группировок разнообразны. Это разнообразие обусловлено с одной стороны огромным множеством признаков, подвергаемых статистическому исследованию, а с другой стороны разнообразными задачами, которые решаются на основе группировок.
2.2. Важнейшая проблема возникающая при группировке.
Важнейшая проблема при построении группировки, является выбор группированного признака или основание группировки.
Группировочный признак - варьирующий признак по которому производится объединение единиц совокупности в группы.
По характеру варьирования, признаки разделяются, как известно, на: атрибутивные и количественные. Это деление определяет особенности решения второй проблемы группировок, а именно - определение числа выделяемых групп. При выборе в качестве группировочных некоторых атрибутивных признаков, может быть выделено только строго определенное количество групп. В частности при группировке населения по полу может быть выделено ...
При группировке предприятий по прибыли может быть выделено 3 группы.
Для многих атрибутивных признаков разрабатываются устойчивые группировки, называемые классификацией. Например: классификация отраслей экономики, классификация занятий населения и др.
При группировке по количественному признаку, вопрос о количестве границы групп следует решать исходя из сущности изучаемого социально-экономического явления. При этом следует принимать во внимание такой показатель, как размах вариаций. Чем больше размах варьирования, тем больше образуется групп и наоборот. Необходимо также принимать во внимание численность единиц совокупности по которой строится группировка. При небольшом объеме совокупности, нецелесообразно образовывать большое число групп, т.к. в этом случае в группах не будет достаточного числа единиц для выявления статистических закономерностей.
Существенным вопросом при группировке по количественному признаку является определение интервалов. Показатели числа групп и величины интервалов находятся в обратной зависимости. Чем больше величина интервалов - тем меньше требуется групп и наоборот.
Интервалом называется разность между его верхней и нижней границей.
По величине группировочного признака интервалы подразделяются на равные и неравные. Равные интервалы применяются в тех случаях, когда изменение группировочного признака внутри совокупности происходит равномерно. Расчет величины равного интервала производится по формуле:
EMBED Equation.2
k - число групп
Xmax, Xmin - соответственно наибольшее и наименьшее значение признака к качеству групп.
Если распределение группировочного признака внутри совокупности неравномерное, то используются неравные интервалы. Неравные интервалы могут быть прогрессивно возрастающими и прогрессивно убывающими. часто при группировке применяются так называемые специализированные интервалы, т.е. такие, которые определяются исходя из цели исследования и сущности явления. Например: при группировке имеющей целью охарактеризовать трудоспособное население страны используются пятилетние интервалы возраста людей.
Третьей проблемой построения группировок является обозначение границ интервалов. При выделении интервалов по дискретным количественным признакам следует обозначать их границы т.о., чтобы нижняя граница последующего интервала отличалась от верхней границы предыдущего на единицу.
При группировке по непрерывному количественному признаку границы обозначаются так, чтобы группы были четко отделены одна от другой. Это достигается добавлением числовым границам интервалов указаниям о том, куда следует относить единицу обладающей группировочным признаком в размерах точно совпадающих с границами интервалов. Обычно дополнительные разъяснения к числовым границам интервалов образуемым по непрерывным количественным принципам выражаются словами: «более», «менее», «свыше» и т.д.
2.3. Виды группировок.
В зависимости от задач, решаемых с помощью группировок выделяют следующие их виды:
- типологические
- структурные
- аналитические
Главная задача типологической состоит в классификации социально-экономических явлений путем выделения однородных к качественным отношениям групп.
Качественная однородность при этом понимается в том смысле, что в отношении изучаемого свойства все единицы совокупности подчиняются одному закону развития. Например: группировка предприятиям отраслей экономики.
Абсолютные и относительные величины.
Абсолютной величиной называется показатель, выражающий размеры социально-экономического явления.
Относительной величиной в статистике называется показатель, выражающий количественное соотношение между явлениями. Он получается в результате деления одной абсолютной величины на другую абсолютную величину. Величина с которой мы производим сравнения называется основанием или базой сравнения.
Абсолютные величины - всегда величины именованные.
Относительные величины выражаются в коэффициентах, процентах, промили и т.д.
Относительная величина показывает, во сколько раз, или на сколько процентов сравниваемая величина больше или меньше базы сравнения.
В статистике различают 8 видов относительных величин:
1. Сущность и значение средних величин.
Средние величины являются одними из наиболее распространенных обобщающих статистических показателей. Они имеют своей целью одним числом охарактеризовать статистическую совокупность состоящую из меньшинства единиц. Средние величины тесно связаны с законом больших чисел. Сущность этой зависимости заключается в том, что при большом числе наблюдений случайные отклонения от общей статистики взаимопогашаются и в среднем более отчетливо проявляется статистическая закономерность.
С помощью метода средних решаются следующие основные задачи:
1. Характеристика уровня развития явлений.
2. Сравнение двух или нескольких уровней.
3. Изучение взаимосвязей социально-экономических явлений.
Анализ размещения социально-экономических явлений в пространстве.
Для решения этих задач статистическая методология разработала различные виды средних.
2. Среднее арифметическое.
Для выяснения методики расчета средней арифметической используем следующие обозначения:
X - арифметический признак
X (X1, X2, ... X3) - варианты определенного признака
n - число единиц совокупности
EMBED Equation.2 - средняя величина признака
В зависимости от исходных данных средняя арифметическая может быть рассчитана двумя способами:
1. Если данные статистического наблюдения на сгруппированы, или сгруппированные варианты имеют одинаковые частоты, то рассчитывается средняя арифметическая простая:
EMBED Equation.2
2. Если частоты сгруппированы в данных разные, то рассчитывается среднее арифметическое взвешанное:
EMBED Equation.2
EMBED Equation.2 - численность (частоты) вариантов
EMBED Equation.2 - сумма частот
Среднее арифметическое рассчитывается по разному в дискретных и интервальных вариационных рядах.
В дискретных рядах варианты признака умножаются на частоты, эти произведения суммируются и полученная сумма произведений делится на сумму частот.
Рассмотрим пример вычисления средней арифметической в дискретном ряду:
EMBED Equation.2
В интервальных рядах значение признака задано, как известно, в виде интервалов, поэтому, прежде чем рассчитывать среднюю арифметическую, нужно перейти от интервального ряда к дискретному.
В качестве вариантов Xi используется середина соответствующих интервалов. Они определяются как полусумма нижней и верхней границ.
Если у интервала отсутствует нижняя граница, то его середина определяется как разность между верхней границей и половиной величины следующих интервалов. При отсутствии верхних границ, середина интервала определяется как сумма нижней границы и половины величины предыдущего интервала. После перехода к дискретному ряду дальнейшие вычисления происходят по методике рассмотренной выше.
Если веса fi заданы не в абсолютных показателях, а в относительных, то формула расчета средней арифметической будет следующей:
EMBED Equation.2
pi - относительные величины структуры, показывающие, какой процент составляют частоты вариантов в сумме всех частот.
Если относительные величины структуры заданы не в процентах, а в долях, то среднее арифметическое будет рассчитываться по формуле:
EMBED Equation.2
3. Средняя гармоническая.
Средняя гармоническая является первообразной формой средней арифметической. Она рассчитывается в тех случаях, когда веса fi не заданы непосредственно, а входят как сомножитель в один из имеющихся показателей. Также как и арифметическая, средняя гармоническая может быть простой и взвешанной.
Средняя гармоническая невзвешанная:
EMBED Equation.2
Средняя гармоническая смешанная:
EMBED Equation.2
Wi - произведение вариантов на частоты
При расчете средних величин необходимо помнить о том, что всякие промежуточные вычисления должны приводить как в числителе, так и в знаменателе и имеющим экономический смысл показателям.
4. Структурное среднее.
Структурное среднее характеризует состав статистической совокупности по одному из варьирующих признаков. К этим средним относятся мода и медиана.
Мода - такое значение варьирующего признака, которое в данном ряду распределения имеет наибольшую частоту.
В дискретных рядах распределений мода определяется визуально. Сначала определяется наибольшая частота, а по ней модальное значение признака. В интервальных рядах для вычисления моды используется следующая формула:
EMBED Equation.2
Xmo - нижняя граница модальности (интервал ряда с наибольшей частотой)
Mo - величина интервала
fMo - частота модального интервала
fMo-1 - частота интервала предшествующего модальному
fMo+1 - частота интервала следующего за модальным
Медианой называется такое значение варьирующего признака, которое делит ряд распределения на две равные части по объему частот. Медиана рассчитывается по разному в дискретных и интервальных рядах.
1. Если ряд распределения дискретный и состоит из четного числа членов, то медиана определяется как средняя величина из двух серединных значений рангированного ряда признаков.
2. Если в дискретном ряду распределения нечетное число уровней, то медианой будет серединное значение рангированного ряда признаков.
В интервальных рядах медиана определяется по формуле:
EMBED Equation.2
EMBED Equation.2 - нижняя граница медианного интервала (интервала для которого накопленная частота впервые превысит полусумму частот)
Me - величина интервала
EMBED Equation.2 - сумма частот ряда
EMBED Equation.2 - сумма накопленных частот предшествующих медианному интервалу
EMBED Equation.2 - частота медианного интервала
1. Общее понятие о вариации.
Вариацией называется различие значений признака у отдельных единиц совокупности.
Вариация возникает в силу того, что отдельные значения признака формируются по влияние большого числа взаимосвязанных факторов. Эти факторы часто действуют в противоположных направлениях и их совместное действие формирует значение признаков у конкретной единицы совокупности. Необходимость изучения вариаций связана с тем, что средняя величина, обобщающая данные статистического наблюдения, на показывает как колеблется вокруг нее индивидуальное значение признака. Вариации присущи явлениям природы и общества. При этом революция в обществе происходит быстрее, чем аналогичные изменения в природе. Объективно существуют также вариации в пространстве и во времени.
Вариации в пространстве показывают различие статистических показателей относящихся к различным административно-территориальным единицам.
Вариации во времени показывают различие показателей в зависимости от периода или момента времени к которым они относятся.
2. Меры вариаций.
К примерам вариаций относятся следующие показатели:
1. размах вариаций
2. среднее линейное отклонение
3. среднее квадратическое отклонение
4. дисперсия
5. коэффициент
1. Размах вариаций является ее простейшим показателем. Он определяется как разность между максимальным и минимальным значение признака. Недостаток этого показателя заключается в том, что он зависит только от двух крайних значений признака (min, max) и не характеризует колеблимость внутри совокупности. R=Xmax-Xmin.
2. Среднее линейное отклонение является средней величиной абсолютных значений отклонений от средней арифметической. Оно определяется по формуле:
EMBED Equation.2 - простая EMBED Equation.2
Отклонения берутся по модулю, т.к. в противном случае, из-за математических свойств средней величины, они всегда были бы равны нулю.
4. Дисперсия (средний квадрат отклонений) имеет наибольшее применение в статистике как показатель меры колеблимости.
Дисперсия определяется по формулам:
EMBED Equation.2 EMBED Equation.2
пример: стр. 36
Дисперсия является именованным показателем. Она измеряется в единицах соответствующих квадрату единиц измерения изучаемого признака. В данном случае она показывает, что средний размер отклонения прибыли по 50 предприятиям от средней прибыли составляет 1,48.
Дисперсия может быть также определена по формуле:
EMBED Equation.2 ; EMBED Equation.2
3. Среднее квадратическое отклонение определяется как корень из дисперсии.
EMBED Equation.2 EMBED Equation.2
По исходным данным приведенным выше, среднее квадратическое отклонение равно:
EMBED Equation.2
5. Коэффициент вариаций определяется как отношение среднего квадратического отклонения к средней величине признака, выраженное в процентах:
EMBED Equation.2
Он характеризует количественную однородность статистической совокупности. Если данный коэффициент < 50%, то это говорит об однородности статистической совокупности. Если же совокупность не однородна, то любые статистические исследования можно проводить только внутри выделенных однородных групп.
3. Дисперсия альтернативного признака.
Альтернативными называются 2 взаимоисключающих друг друга признака. То признаки, которыми каждая отдельная единица совокупности либо обладает, либо не обладает. Наличие альтернативного признака принято обозначать через единицу, а отсутствие через 0. Долю единиц обладающих данным признаком обозначают через p (п), а долю единиц на обладающих данным признаком обозначают через q. При этом p+q=1.
Дисперсия альтернативного признака определяется по формуле:
EMBED Equation.2
4. Виды дисперсий. Привила их сложения.
Если исследуемую статистическую совокупность разделить на группу, то для каждой из них можно определить групповые средние и дисперсии. Эти дисперсии будет характеризовать колеблимость изучаемого признака каждой отдельной группе. На этой основе можно определить среднюю изнутри групповых дисперсий.
EMBED Equation.2
ni=fi - численность единиц в отдельных группах
Эта дисперсия характеризует случайную вариацию признака, на зависящую от фактора положенного в основание группировки.
Вычисляется также межгрупповая дисперсия EMBED Equation.2 .
EMBED Equation.2
EMBED Equation.2 и ni=fi соответственно средние и численности по отдельным группам.
Эта дисперсия характеризует вариацию по влиянием группировочного признака. Сумма средней изнутри групповых и межгрупповой дисперсий позволяет определить общую дисперсию.
EMBED Equation.2
Данное равенство называют правилом сложения дисперсий.
EMBED Equation.2 ; EMBED Equation.2 , т.е. существует тесная зависимость между изготовлением деталей и другими показателями.
Если значения исследуемого признака выражаются в долях или коэффициентах, то правило сложения дисперсий выражается следующими формулами:
EMBED Equation.2 EMBED Equation.2 EMBED Equation.2
ni - численность единиц в отдельных группах
pi - доля изучаемого признака во всей совокупности
EMBED Equation.2 EMBED Equation.2
EMBED Equation.2
средняя из внутригрупповых дисперсий для долей признаков
1. Виды и формы зависимости между социально-экономическими явлениями.
Многообразие взаимосвязей в которых находятся социально-экономические явления, рождают необходимость в их классификации.
По видам различают функциональную и корреляционную зависимость.
Функциональной называют такую зависимость, при которой одному значению факторного признака X соответствует одно строго определенное значение результативного признака Y.
В отличие от функциональной зависимости, корреляционная выражает такую связь между социально-экономическими явлениями, при которой одному значению факторного признака X могут соответствовать несколько значений результативного признака Y.
По направлению различают прямую и обратную зависимость.
Прямой называют такую зависимость, при которой значение факторного признака X и результативного признака Y изменяются в одном направлении. Т.о. при увеличении значения X, значения Y в среднем увеличиваются, а при уменьшении X - Y уменьшается.
Обратная зависимость между факторным и результативным признаками, если они изменяются в противоположных направлениях.
2. Статистические методы изучения взаимосвязей.
Важное место в статистическом изучении взаимосвязей занимают следующие методы:
1. Метод приведения параллельных данных.
2. Метод аналитических группировок.
3. Графический метод.
4. Балансовый метод.
5. Индексный метод.
6. Корреляционно-регрессионный.
1. Сущность метода приведения параллельных данных заключается в следующем:
Исходные данные по признаку X располагаются в порядке возрастания или убывания, а по признаку Y записываются соответствующие им показатели. Путем сопоставления значений X и Y, делается вывод о наличии и направлении зависимости.
3. Сущность графического метода составляет наглядное представление наличия и направления взаимосвязей между признаками. Для этого значение факторного признака X располагается по оси абсцисс, а значение результативного признака по оси ординат. По совместному расположению точек на графике делают вывод о направлении и наличии зависимости. При этом возможны следующие варианты:
а ?, б/ (вверх) , в\ (вниз).
Если точки на графике расположены беспорядочно (а), то зависимость между изучаемыми признаками отсутствует.
Если точки на графике концентрируются вокруг прямой (б)/, зависимость между признаками прямая.
Если точки концентрируются вокруг прямой (в)\, то это свидетельствует о наличии обратной зависимости.
На основе метода параллельных данных и графического метода, могут быть рассчитаны показатели, характеризующие степень тесноты корреляционной зависимости.
Наиболее кратным из них является коэффициент знаков Фехнера. Он рассчитывается по формуле:
EMBED Equation.2
C - сумма совпадающих знаков отклонений индивидуальных значений признака от средней.
H - сумма несовпадений
Данный коэффициент изменяется в пределах (-1;1).
Значение KF=0 свидетельствует об отсутствии зависимости между изучаемыми признаками.
Если KF=?1, то это говорит о наличии функциональной прямой (+) и обратной (-) зависимости. При значении KF>?0,6? делается вывод о наличии сильной прямой (обратной) зависимости между признаками. Кроме того на основе исходных данных о факторном и результативном признаках, может быть рассчитан коэффициент корреляции рангов Спирмена, который определяется по формуле:
EMBED Equation.2
EMBED Equation.2 - квадраты разности рангов
(R2-R1), n - число пар рангов
Данный коэффициент, как и предыдущий, изменяется в тех же пределах и имеет одинаковую с KF экономическую интерпретацию.
В тех случаях, когда значение X или Y выражаются одинаковыми показателями, коэффициент корреляции рангов рассчитывается по следующей формуле:
EMBED Equation.2
tj - одинаковое число рангов в j - ряду
Если исследуется зависимость между тремя и более математическими признаками, то для ее исследования применяется коэффициент конкордации определяемый по формуле:
EMBED Equation.2
m - количество факторов
n - число наблюдений
S - отклонение суммы квадратов рангов от средней квадратов рангов
3. Изучение зависимости между количественными признаками.
Для исследования взаимосвязи качественных альтернативных признаков, принимающих только 2 взаимоисключающих значения, используется коэффициент ассоциации и контингенции. При расчете этих коэффициентов составляется т.н. таблица 4-х камней, а сами коэффициенты рассчитываются по формуле:
EMBED Equation.2
EMBED Equation.2
Если коэффициент ассоциации ? 0,5, а коэффициент контингенции ? 0,3, то можно сделать вывод о наличии существенной зависимости между изучаемыми признаками.
Если признаки имеют 3 или более градаций, то для изучения взаимосвязей используются коэффициенты Пирсена и Чупрова. Они рассчитываются по формулам:
С - коэффициент Пирсена
К - коэффициент Чупрова
EMBED Equation.2
EMBED Equation.2
? - показатель взаимной сопряженности
K - число значений (групп) первого признака
K1 - число значений (групп) второго признака
EMBED Equation.2
fij - частоты соответствующих клеток таблицы
mi - столбцы таблицы
nj - строки
Для расчета коэффициентов Пирсена и Чупрова составляется вспомогательная таблица:
При ранжировании качественных признаков с целью изучения их взаимосвязи используется коэффициент корреляции Кэндалла.
EMBED Equation.2
n - число наблюдений
S - сумма разностей между числом последовательностей и числом инвервий по второму признаку.
S=P+Q
P - сумма значений рангов, следующих за данными и превышающих его величину
Q - сумма значений рангов, следующих за данными и меньших его величины (учитывается со знаком «-»).
При наличии связанных рангов формула коэффициента Кендалла будет следующей:
EMBED Equation.2
Vx и Vy определяются отдельно для рангов X и Y по формуле:
EMBED Equation.2
5. Методы выявления основной тенденции рядов динамики.
Уровни ряда динамики формируются под вниманием 3-х групп факторов:
1. Факторов определяющих основное направление, т.е. тенденцию развития изучаемого явления.
2. Факторов действующих периодически, т.е. направленных колебаний по неделям месяца, месяцам года и т.д.
3. Факторов действующих в разных, иногда в противоположных направлениях и не оказывающих существенного влияния на уровень данного ряда динамики.
Основной задачей статистического изучения данамики является выявление тенденции.
Основными методами выявления тенденции рядов динамики являются:
- метод укрупнения интервалов
- метод скользящей средней
- метод аналитического выравнивания
1. Сущность метода укрупнения интервалов заключается в следующем:
Исходный ряд динамики преобразуется и заменяется другими состоящими из других уровней, относящихся к укрупненным периодам или моментам времени.
Например: ряд динамики прибыли малого предприятия за 1997 год по кварталам того же года. При этом уровни ряда за укрупненные периоды или моменты времени могут представлять собой либо суммарные, либо средние показатели. Однако в любом случае рассчитанные таким образом уровни ряда более отчетливо выявляют тенденции, поскольку сезонные и случайные колебания при суммировании или определении средних взаимопогашаются и уравновешиваются.
2. Метод скользящей средней, как и предыдущий предполагает преобразование исходного ряда динамики. Для выявления тенденции формируются интервал, состоящий из одинакового числа уровней. При этом каждый последующий интервал получается путем смещения на 1 уровень от начального. По образованным таким образом интервалам определяются в начале сумма, а затем средние. Технически удобнее определять скользящие средние для нечетного интервала. В этом случае рассчитанная средняя величина будет относиться к конкретному уровню ряда динамики, т.е. к середине интервала скольжения.
При определении скользящей средней по четному интервалу, расчетное значение средней величины относится к промежутку между двумя уровнями, и таким образом теряют экономический смысл. Это делает необходимыми дополнительные расчеты связанные с центрированием по формуле арифметической простой из двух соседних не центрированных средних.
? ШВАЧКИН МАКСИМ ДЭ-103