Лабораторная работа № 2. ПОКАЗАТЕЛИ ЗНАЧЕНИЙ ЦЕНТРА И РАЗМАХОВ ВАРИАЦИЙ СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ
Цель работы: приобретение навыков обработки и обобщения индивидуальных значений одного и того же признака у различных единиц совокупности.
Задание. Определить среднюю арифметическую интервального вариационного ряда; медиану; моду; медиану и моду графически по известной кумуляте и гистограмме ряда распределения; размах вариации; среднее линейное отклонение; дисперсию; среднее квадратическое отклонение; квартильное отклонение; первую, вторую и третью квартили; относительные показатели вариации (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации, относительный показатель квартильной вариации); показатель фондовой и децильной дифференциации.
Условие. В качестве условия используется сгруппированный вариационный ряд предшествующей лабораторной работы №1.
Таблица 4.
Выполнение задания. Изучение средних величин первичной статистической информации имеет важное значения для анализа изучаемого признака в исследуемой совокупности разрозненных данных. Средняя величина является обобщающей характеристикой представленного ряда величин, отражает его типичный уровень в конкретных условиях времени и места.
Средняя арифметическая дискретного ряда рассчитывается по формуле
EMBED Equation.3 , (4)
EMBED Equation.3 1,4075.
В интервальном вариационном ряду средняя арифметическая определяется по другой формуле
EMBED Equation.3 , (5)
где EMBED Equation.3 - середина соответствующего интервала вариант значений признака, EMBED Equation.3 - частота повторений данного варианта, j – номер варианты.
В таблице 5 приведены значения середин соответствующих интервалов ряда вариант.
Таблица 5.
Значение EMBED Equation.3 вычисляется по формуле (5)
EMBED Equation.3 .
Медиана соответствует варианте, стоящей в середине ранжированного ряда. Её положение в ряду определяется номером
EMBED Equation.3 , (6)
где N – число единиц совокупности. В данном примере N = 20 (см. п. 3, лаб. раб. №1) и
EMBED Equation.3 . Для определения величины медианы интервального вариационного ряда (табл. 4) используется формула:
EMBED Equation.3 , (7)
где EMBED Equation.3 - нижняя граница медианного интервала, h - величина интервала, EMBED Equation.3 - накопленная частота интервала, предшествующего медианному, EMBED Equation.3 - частота медианного интервала.
По накопленной частоте EMBED Equation.3 рис. 3 определяем, что медиана находится в интервале 1,28-1,52 и вспомогательные параметры соответственно равны: EMBED Equation.3 = 1,28; h =0,24; EMBED Equation.3 = 6; EMBED Equation.3 = 7 .
EMBED Equation.3 .
Полученное значение медианы представлено графически на рис. 7 как абсцисса середины промежутка ординат накопленных частот в пределах от 0 до 20 кумуляты ряда распределения. Практически это означает, что 50% банков с доходами от 50 до 100 млн. руб. имеют рентабельность активов менее 1,434 , остальные – более 1,434 .
Мода – наиболее часто встречающееся значение признака совокупности.
Поскольку наибольшая частота EMBED Equation.3 = 7 соответствует тому же интервалу 1,28-1,52, то мода находится в этом же интервале. Её величину определяют по формуле:
EMBED Equation.3 , (8)
где EMBED Equation.3 - нижняя граница модального интервала, EMBED Equation.3 - частота, соответствующая модальному интервалу, EMBED Equation.3 - предмодальная частота, EMBED Equation.3 - послемодальная частота.
Для приведенного вариационного ряда с равными интервалами используем формулу (7), тогда
EMBED Equation.3 .
Мода как и медиана может быть определена графически по известной гистограмме рис. 6. Для этого правая вершина модального прямоугольника соединяется с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых является модой ряда распределения (рис. 6).
Таким образом, в данной совокупности наиболее часто встречается рентабельность активов равная 1,424 для банков с доходами от 50 до 100 млн. руб.
Замечание 1: Различаются моды дискретного и вариационного интервального рядов. Первые устанавливаются непосредственно по определению, вторые применением формулы (7).
Замечание 2: В симметричных рядах все перечисленные средние показатели одинаковы EMBED Equation.3 = EMBED Equation.3 = EMBED Equation.3 . Поэтому для общей характеристики ряда достаточно вычислить среднюю арифметическую величину.
Замечание 3: Для асимметричных рядов распределения медиана является наиболее предпочтительной характеристикой центра распределения, потому что находится между средней арифметической и модой.
Размахом вариации называется разность между максимальным и минимальным значениями признака совокупности (рис. 1).
R = xmax ? xmin . (9)
Используя данные лабораторной работы № 1 R = 2 ? 0,8 = 1,2 .
Среднее линейное отклонение EMBED Equation.3 вычисляется по следующим формулам:
для сгруппированных данных рис. 3
EMBED Equation.3 , (10)
где K – число групп совокупности, наибольшее значение варианты;
для не сгруппированных данных рис. 1, 2 ( EMBED Equation.3 1,4075)
EMBED Equation.3 . (11)
Тогда применяя формулы (9) и (10) в среде Excel, получается, EMBED Equation.3 = 0,2232 , EMBED Equation.3 = 0,26525.

Замечание 4: Средние линейные отклонения для данных, сгруппированных различным образом, могут отличаться.
6. Дисперсия - это средняя из квадратов отклонений вариантов значений признака от их средней величины. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии. Различают дисперсию для сгруппированных данных
EMBED Equation.3 , (12)
где K – число групп совокупности, наибольшее значение варианты;
для не сгруппированных данных
EMBED Equation.3 . (13)
Дисперсия сгруппированных данных EMBED Equation.3 1,71648/20 = 0,085824; среднее квадратическое отклонение EMBED Equation.3 0,292957 вычислены по данным рис. 10 б.
Дисперсия и среднеквадратическое отклонение дискретного ряда представлены на рис. 11.



8. Квартили – значения признака в ранжированном ряду распределения, выбранные специальным образом. Четверть единиц должна быть меньше по величине, чем Q1; другая четверть единиц заключена между значениями Q1 и Q2; третья четверть единиц - между значениями Q2 и Q3; остальные превосходят Q3 . Значения Qi ( EMBED Equation.3 ) вычисляются по формула аналогичным формуле для расчета медианы:
EMBED Equation.3 , (14)
где EMBED Equation.3 - нижняя граница интервала, в котором находится первая квартиль, EMBED Equation.3 - сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль, EMBED Equation.3 - частота интервала, в котором находится первая квартиль. Таким же образом определяются Q2 и Q3 .
EMBED Equation.3 , (15)
EMBED Equation.3 , (16)
Вычислим первую, вторую и третью квартили по формулам (14)-(16):
EMBED Equation.3 = 1,235 ;
EMBED Equation.3 = 1, 434 ;
EMBED Equation.3 = 1,652 .
Сравним полученные величины квартилей с величинами, полученными применением статистических функций «КВАРТИЛЬ» порядка 1, 2 и 3 к дискретному ранжированному ряду (рис. 2) в программной среде Excel рис. 12.

Рис. 12
Замечание 5: Вторая квартиль EMBED Equation.3 должна совпадать с медианой (7) для интервального вариационного ряда (табл. 4).
Квартильное отклонение Q можно использовать для обобщения характеристики вариаций признаков в рассматриваемой совокупности, если, по каким-либо причинам, невозможно определение крайних значений рядов распределения с открытыми границами
EMBED Equation.3 . (17)
Для симметричных или мало-асимметричных распределений Q EMBED Equation.3 EMBED Equation.3 .
EMBED Equation.3 = 0,2085 EMBED Equation.3 EMBED Equation.3 = 0,19530 .
10. Относительные показатели вариации используются для сравнения колеблемости различных признаков в одной и той же совокупности или при сравнении колеблемости одного и того же признака в нескольких совокупностях.
Коэффициент осцилляции EMBED Equation.3 , (18)
относительное линейное отклонение EMBED Equation.3 , (19)
коэффициент вариации EMBED Equation.3 , (20)
относительный показатель квартильной вариации EMBED Equation.3 ; (21)
EMBED Equation.3 = 84,27% ;
EMBED Equation.3 = 15,67% ;
EMBED Equation.3 = 20,57% ;
EMBED Equation.3 = 14,54% .
Совокупность является однородной, если коэффициент вариации не превышает 33%. Поскольку EMBED Equation.3 = 20,57% < 33% , то по размеру рентабельности и прибыли совокупность банков является однородной.
11. Показатель фондовой дифференциации рассчитывается по первичным данным и характеризует отношение средней величины из 10% наибольших значений совокупности к средней величине из 10% наименьших значений совокупности
EMBED Equation.3 . (22)
Два коммерческих банка, что составляет 10% от общего количества банков, имеют наибольший уровень рентабельности 1,98 и 2 (см. рис. 2), поэтому EMBED Equation.3 = EMBED Equation.3 = 1,99 . И два коммерческих банка имеют наименьший уровень рентабельности 0,8 и 0,85 , поэтому EMBED Equation.3 = EMBED Equation.3 = 0,825 . Следовательно, коэффициент фондовой дифференциации будет таким:
EMBED Equation.3 = 2,412 .
Это означает, что размер рентабельности у 10% банков с наивысшими доходами в 2,4 раза превышает размер прибыли 10% коммерческих банков с наименьшими доходами.
Для определения децильной дифференциации используются формулы расчета квартилей. Сначала находится номер первой децили EMBED Equation.3 , затем девятой EMBED Equation.3 . EMBED Equation.3 2,1 ; EMBED Equation.3 18,9 .
EMBED Equation.3 = 1,052 ;
EMBED Equation.3 = 1,803 .
Коэффициент децильной дифференциации устанавливается из соотношения
EMBED Equation.3 . (23)
EMBED Equation.3 = 1,714 .
Это означает, что отношение децили наиболее рентабельных банков в совокупности к децили наименее рентабельных банков составляет 1,714. Таким образом, уровень рентабельности наиболее прибыльных банков в 1,714 раз выше уровня наименее прибыльных банков.
Выводы. Выводы содержатся в каждом пункте выполненного задания.
Варианты заданий. Варианты указаны римскими цифрами в лабораторной работе №1.