Лабораторная работа № 1. ОСНОВНЫЕ ПОНЯТИЯ СТАТИСТИКИ И СВОЙСТВА СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ
Цель работы: приобретение навыков группирования и обработки первичной статистической информации в интерактивной среде Excel.
Задание. Проранжировать первичный ряд данных, определить частоты и частости нового ряда, найти абсолютную и относительные плотности распределения, перегруппировать данные для сопоставления и анализа двух рядов, графически изобразить кривые (плотности) распределения рядов, представить данные в виде полигона частот, гистограмм, кумулятивных кривых по известным накопленным частотам.
Условие. Имеются разрозненные данные по рентабельности активов банков с доходами от 50 до 100 млн. долл.:
1,51; 0,85; 1,37; 1,62; 0,80; 2,0; 1,49; 1,58; 1,75; 1,24; 1,28; 1,04; 1,98; 1,15; 1,66; 1,33; 1,73; 1,13; 1,36; 1,28.
Сравнить полученный сгруппированный ряд с известным интервальным рядом распределения по уровню рентабельности активов банков с доходами от 100 до 300 млн. долл.
Табл. 1.
Выполнение задания.
В программной среде Excel заполняется столбец исходных данных рис. 1.

Рис. 1.
Выполняется сортировка столбца А - первичного ряда в порядке возрастания. В результате получен новый интервальный ранжированный ряд рис.2.

Рис. 2.
Определяются частоты и частости нового ряда. Для этого используется данные об объеме совокупности исследуемых банков N = 20 . Дискретный вариационный ряд разбивается на интервалы, число которых подсчитывается по формуле Стержесса
k = EMBED Equation.3 1 + 3,322 lg N EMBED Equation.3 , (1)
в которой квадратные скобки означают округление числа 5,32 , тогда k = 5. Длина частичного интервала определяется по формуле
EMBED Equation.3 . (2)
xmax = 2,0 , xmin = 0,8 , h = 0,24. Тогда границы интервалов будут такими:

Подсчитывается количество банков принадлежащих каждому из интервалов. Вычисляется накопленная частота и процентное отношение частоты к общему объему всей совокупности N = 20 или частость. Для сопоставления полученных данных интервального вариационного ряда с данными другого вариационного ряда с неравными интервалами необходимо рассчитать относительную плотность распределения
EMBED Equation.3 , hi = h . (3)

Рис. 3.
Необходимо перегруппировать данные исследуемого интервального вариационного ряда для сопоставления и анализа двух рядов.
Таблица 2.
Расчетная схема представлена ниже.
Необходимо вычислить новые величины интервалов, используя заготовленный рисунок 4:
h01 = y0 – x0 ,
h11 = x1 – y0 ,
h12 = y1 – x1 ,
h21 = x2 – y1 ,
h22 = x3 – x2 ,
h23 = x4 – x3 ,
h24 = y2 – x4 ,
h31 = x5 – y2 ,
h32 = x6 – x5 ,


Рис.
Рис. 4.
Здесь – узловые точки xi рентабельности активов, отстоящие друг от друга на один и тот же равный шаг h , yi – узловые точки интервального ряда рис. 1 (i = EMBED Equation.3 ).
На промежутках [y-1, y0] U [y0, y1] U [y1, y2] U [y2, y3] частости Wi перераспределяются следующим образом:
[y-1, y0] ? W0 = h01m1 ,
[y0, y1] ? W1 = h11m1 + h12m2 ,
[y1, y2] ? W2 = h21m2 + h22m3+ h23m4+ h24m5 ,
[y2, y3] ? W3 = h31m5 + h32m6 ,

Полученными новыми значениями Wi заполняется третий столбец таблицы 2.
Графическое представление кривой (ненормированной плотности) распределения исходного ряда рис. 3.
EMBED Excel.Chart.8 \s
Рис. 5.
Полигон частот рис. 6.
EMBED Excel.Chart.8 \s
Рис. 6.
Гистограмма рис. 7.
EMBED Excel.Chart.8 \s
Рис. 7.
Кумулятивная кривая накопленных частот.
EMBED Excel.Chart.8 \s
Рис. 8.
Сравнительная оценка частот интервальных вариационных рядов по уровню рентабельности активов банков с доходами от 100 до 300 млн. долл. и от 50 до 100 млн. долл. (табл. 2).
EMBED Excel.Chart.8 \s
Рис. 9.
Выводы. Количество банков с доходами от 100 до 300 млн. долл. до уровня рентабельности 1,25 больше, чем банков с доходами от 50 до 100 млн. долл. После уровня рентабельности 1,25 банков с доходами от 50 до 100 млн. долл. значительно больше, чем банков с доходами от 100 до 300 млн. долл. Экстремальные значения при рентабельности активов 0,9 имеют 30 % банков с доходами от 100 до 300 млн. долл. и при рентабельности активов 1,6 имеют 43,33 % банков с доходами от 50 до 100 млн. долл.
Представленная графическая зависимость позволяет сделать вывод о том, что наиболее рентабельными являются банки ряда 2 (рис. 9).

Варианты заданий. Варианты указаны римскими цифрами.
Сгруппированный ряд сравнивать с рядом заданным в табл. 1.
Таблица 3.