ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ КАФЕДРА СТАТИСТИКИ ОТЧЕТ о результатах выполнения компьютерной лабораторной работы № 1 «Автоматизированный априорный анализ статистической совокупности в среде MS Excel» Вариант № 22 ВОРОНЕЖ 2005 Постановка задачи Имеются следующие выборочные данные по предприятиям одной из отраслей промышленности региона в отчетном году ( выборка 20 % - ная механическая ), млн.руб.: Таблица № 1 № предприятия п/п Выручка от продажи продукции Затраты на производство и реализацию продукции
1 36,450 30,255
2 23,400 20,124
3 46,540 38,163
4 59,752 47,204
5 41,415 33,546
6 26,860 22,831
7 79,200 60,984
8 54,720 43,776
9 40,424 33,148
10 30,210 25,376
11 42,418 34,359
12 64,575 51,014
13 51,612 41,806
14 35,420 29,753
15 14,400 12,528
16 36,936 31,026
17 53,392 42,714
18 41,000 33,620
19 55,680 43,987
20 18,200 15,652
21 31,800 26,394
22 39,204 32,539
23 57,128 45,702
24 28,440 23,890
25 43,344 35,542
26 70,720 54,454
27 41,832 34,302
28 69,345 54,089
29 35,903 30,159
30 50,220 40,678
В проводимом статистическом исследованные предприятия выступает как единицы выборочной совокупности, а показатели Выручка от продажи продукции и Затраты на производство и реализацию продукции – изучаемые признаки единиц. Задание 1. Выявление и исключение из выборки аномальных единиц наблюдения. Построение диаграммы рассеяния изучаемых признаков. Визуальный анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков и их удаление из первичных данных. Выявление аномальных значений признака наиболее удобно производить графическим методом. Для визуального анализа разброса единиц совокупности можно использовать различные типы графиков, в том числе точечный график. По расположению точек на точечном графике легко выявить значения признака, которые резко выделяются из общей, однородной массы значений признаков единиц совокупности. В настоящей лабораторной работе в качестве исходных данных представлены выборочные значения двух признаков - Выручка от продажи продукции и Затраты на производство и реализацию продукции. Для выявления аномальных значений этих признаков можно построить график для каждого из признаков в отдельности, однако анализ упростится, если использовать диаграмму рассеяния. Диаграмма рассеяния – это точечный график, осям X и Y которого сопоставлены два изучаемых признака единиц совокупности. В случае, если признаки X и Y являются взаимосвязанными, диаграмму рассеяния принято называть корреляционным полем. При построении диаграммы рассеяния по оси X следует расположить значения признака Выручка от продажи продукции, а по оси Y – соответствующие значения признака Затраты на производство и реализацию продукции. Построение диаграммы рассеяния в среде Excel осуществляется с помощью инструмента построения графика Мастер диаграмм. При построении точечного графика в режиме Мастер диаграмм данные первого выделенного столбца (Выручка от продажи продукции) автоматически сопоставляются оси X, данные второго выделенного столбца (Затраты на производство и реализацию продукции) – оси Y.
Рис. 1 . Диаграмма рассеяния Полученный график можно произвольно перемещать по полю рабочего листа, изменять его размеры. Для перемещения графика в удобное для просмотра место следует осуществить так называемый «захват мышью», т.е. установить курсор на произвольное место белой области графика, нажать левую кнопку мыши и , удерживая ее, переместить график в требуемое место, затем отпустить клавишу. Для изменения размеров графика производятся аналогичные действия, однако местом «захвата мышью» должен быть один из углов графика. В данной задаче отсутствуют аномальные значения прзнаков. Задание 2. Оценка описательных статистических параметров совокупности. Расчет описательных показателей выборочной и генеральной совокупностей по несгруппированным выборочным данным с использованием инструментов Описательная статистика и Мастер функций. Оценка средней и предельной ошибок выборки для средней величины признака, а также границ, в которых эта средняя будет находиться в генеральной совокупности при заданных уровнях надежности. Описательная (дескриптивная) статистика является инструментом статистического описания данных, представляющих всю наблюдаемую совокупность в целом. Цель описательной статистики – получение сводных (обобщающих) показателей, характеризующих исходную совокупность данных как генеральную ( а не как выборку из некоторой другой совокупности большего объема). Для численной оценки обобщающих показателей совокупности используются так называемые описательные статистики, представляющие собой однозначные функции на множестве наблюдаемых данных, определяющие значения оцениваемых обобщающих показателей совокупности. Описательные статистики рассчитываются по несгруппированным данным и реализуют точные функциональные зависимости значений показателей от исходных данных ( в отличие от приближенных статистических оценок, выводимых с заданным уровнем надежности). Показатели, вычисляемые с помощью описательных статистик ( так называемые описательные параметры), можно разбить на 3 группы - показатели положения вариантов значений признака, вариации признака и особенностей формы его распределения. Между терминологией инструмента Описательная статистика и терминами, принятыми в отечественной статистике, имеется ряд расхождений. Согласование терминологии приводится в табл. 2. СТАТИСТИЧЕКАЯ ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ Таблица № 2 Параметр инструмента ОПИСАТЕЛЬНАЯ СТАТИСТИКА Статистический показатель Обозна-чение
Среднее Средняя арифметическая величина признака в выборке, вычисленная по несгруппированным данным
Стандартная ошибка Средняя ошибка выборки - среднее квадратическое отклонение выборочной средней x от математического ожидания генеральной средней x
Медиана Значение признака, приходящееся на середину ранжированного ряда выборочных данных Ме
Мода Значение признака, повторяющееся в выборке с наибольшей частотой Мо
Стандартное отклонение Генеральное среднее квадратическое отклонение, оцененное по выборке
Дисперсия выборки Генеральная дисперсия, оцененная по выборке
Эксцесс Коэфициент эксцесса, оценивающий по выборке значение эксцесса в генеральной совокупности
Асимметричность Коэффициент асимметрии, оценивающий по выборке величину асимметрии в генеральной совокупности
Интервал Размах вариации в выборке R
Минимум Минимальное значение признака в выборке xmin
Максимум Максимальное значение признака в выборке xmax
Сумма Суммарное значение элементов выборки
Счет Объем выборки n
Уровень надежности (95,0%) Предельная ошибка выборки, оцененная с заданным уровнем надежности
Запуск инструмента Описательная статистика осуществляется следующей последовательностью действий6
Входной интервал диапазон ячеек таблицы (Выручка от продажи продукции и Затраты на производство и реализацию продукции); Группирование по столбцам; Итоговая статистика – Активизировать; Уровень надежности – Активизировать; Уровень надежности 95,4; Выходной интервал адрес ячейки заголовка первого столбца; ОК; В результате указанных действий Excel осуществляет вывод таблицы статистик в заданный диапазон рабочего файла. Таблица № 3 Описательные статистики
Уровень надежности(95,4%) 5,925488871 Уровень надежности(95,4%) 4,399204414
Алгоритм 2. Расчет предельной ошибки выборки при Р = 0,683
Входной интервал диапазон ячеек таблицы (Выручка от продажи продукции и Затраты на производство и реализацию продукции); Итоговая статистика – Снять флажок; Уровень надежности – Активизировать; Уровень надежности 68,3; Выходной интервал адрес ячейки , для предельной ошиб