EMBED MSPhotoEd.3
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности в среде MS Excel»
Вариант № 10




Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Выборочные данные приведены в (табл. 1).
Таблица 1
Таблица 1. Исходные данные
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (EMBED Equation.3), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( EMBED Equation.3 ), средние отклонения – линейное (EMBED Equation.3) и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны ( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ).
Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности
Рассчитать генеральную дисперсию EMBED Equation.3 , генеральное среднее квадратическое отклонение EMBED Equation.3 и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.







2. Выводы по результатам выполнения лабораторной работы
Задание 1
Выявление и удаление из выборки аномальных единиц наблюдения
Первичные данные выборочной совокупности могут содержать аномальные значения изучаемых признаков. Задание 1 заключается в их выявлении и исключении из дальнейшего рассмотрения с целью обеспечения устойчивости данных статистического анализа.
Алгоритм выполнения Задания 1
Этап 1. Построение диаграммы рассеяния изучаемых признаков.
Выделить мышью оба столбца исходных данных в диапазоне B4:C35.
Вставка=>Диаграмма=>Точечная=>Готово.
В результате выполнения этих действий на рабочем листе Excel появится диаграмма рассеяния (Рис.1).
EMBED Excel.Chart.8 \s
Рис.1. Аномальные значения признаков на диаграмме рассеяния.

Этап 2. Визуальный анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков, их удаление из первичных данных
Найти на графике точку, соответствующую аномальному наблюдению. Если таких точек нет, то перейти к действию 7, если есть - к действиям 2 - 6.
Подвести курсор к точке на диаграмме рассеяния, соответствующей аномальному наблюдению. После непродолжительного времени возле точки автоматически появится надпись, содержащая значения признаков этого наблюдения в формате (X,Y).
В исходных данных визуально (либо с помощью поисковых средств Excel) найти в табл.1 строку, соответствующую выявленной аномальной единице наблюдения (предприятию). Скопировать эту строку в табл.2.
Выделить мышью всю адресную строку с данными, подлежащими удалению.
Правка=>Удалить.
Выполнять действия 1-5 до полного удаления всех аномальных наблюдений.
Переместить диаграмму рассеяния в область ячеек, начиная с ячейки F4.
Задание 2
Оценка описательных статистических параметров
совокупности
Обобщающие статистические показатели совокупности исчисляются на основе анализа вариационных рядов распределения. Однако пакет Excel позволяет рассчитать многие из этих показателей непосредственно по первичным данным наблюдения, используя инструмент Описательная статистика надстройки Пакет анализа, а также статистические функции инструмента Мастер функций.
Выполнение Задания 2 заключается в автоматизированном решении двух статистических задач:
Расчет описательных показателей выборочной и генеральной совокупностей по несгруппированным выборочным данным с использованием инструментов Описательная статистика и Мастер функций.
Оценка средней и предельной ошибок выборки для средней величины признака, а также границ, в которых эта средняя будет находиться в генеральной совокупности при заданных уровнях надежности.
Алгоритмы выполнения Задания 2
Выполнение задания включает три этапа:
1.Расчет описательных параметров выборочной и генеральной совокупностей с использованием инструмента Описательная статистика.
2.Оценка предельных ошибок выборки для различных уровней надежности в режиме Описательная статистика.
3.Расчет описательных параметров выборочной совокупности с использованием инструмента Мастер функций.
Этап 1. Расчет описательных параметров выборочной и генеральной совокупностей с использованием инструмента ОПИСАТЕЛЬНАЯ СТАТИСТИКА
1.Сервис=>Анализ данных=>Описательная статистика=>OK;
2.Входной интервал<=диапазон ячеек таблицы 3, Столбец 1 и Столбец 2;
3.Группирование =>по столбцам;
4.Итоговая статистика - Активизировать;
5.Уровень надежности - Активизировать;
6.Уровень надежности <= 95,4;
7.Выходной интервал <= адрес ячейки заголовка первого столбца табл.3;
8.OK;
9.При появлении окна с сообщением "Выходной интервал накладывается на имеющиеся данные" =>ОК.
В результате указанных действий Excel осуществляет вывод таблицы описательных статистик в заданный диапазон рабочего файла.
Этап 2. Оценка предельных ошибок выборки для различных уровней надежности в режиме Описательная статистика.
Алгоритм 2.1. Расчет предельной ошибки выборки при P=0,683
Сервис =>Анализ данных =>Описательная статистика =>OK;
Входной интервал<= диапазон ячеек таблицы 4а, Столбец 1 и Столбец 2;
Итоговая статистика – Снять флажок;
Уровень надежности – Активизировать;
Уровень надежности<= 68,3;
Выходной интервал <= адрес ячейки, заголовка первого столбца табл.4а;
OK;
При появлении окна с сообщением "Выходной интервал накладывается на имеющиеся данные" =>ОК.
Алгоритм 2.2. Расчет предельной ошибки выборки при P=0,997
Сервис=>Анализ данных=>Описательная статистика=>OK;
Входной интервал<= диапазон ячеек таблицы 4б, Столбец 1 и Столбец 2;
Итоговая статистика – Снять флажок;
Уровень надежности – Активизировать;
Уровень надежности <= 99,7;
Выходной интервал <= адрес ячейки заголовка первого столбца табл.4б;
OK;
При появлении окна с сообщением "Выходной интервал накладывается на имеющиеся данные" =>ОК.
В результате работы алгоритмов 2.1 и 2.2 Excel выводит в соответствующие ячейки табл.4 рабочего файла значения предельных ошибок выборки при P=0,683 и P=0,997.
Этап 3. Расчет описательных параметров выборочной совокупности
с использованием инструмента Мастер функций
Алгоритм 3.1. Расчет выборочного стандартного отклонения ?n для признака
Среднегодовая стоимость основных производственных фондов
Установить курсор в ячейку В83;
Вставка =>Функция;
Статистические =>СТАНДОТКЛОНП=>ОК;
Число 1<= диапазон ячеек табл.1, содержащих значения первого признака.
Алгоритм 3.2. Расчет выборочного стандартного отклонения ?n для признака
Выпуск продукции
Установить курсор в ячейку D83;
Вставка =>Функция;
Статистические =>СТАНДОТКЛОНП=>ОК;
Число 1<= диапазон ячеек табл.1, содержащих значения второго признака.
Алгоритм 3.3. Расчет выборочной дисперсии ?2n для признака
Среднегодовая стоимость основных производственных фондов
Установить курсор в ячейку В84;
Вставка =>Функция;
Статистические =>ДИСПР=>ОК;
Число1<= диапазон ячеек табл.1, содержащий значения первого признака.
Алгоритм 3.4. Расчет выборочной дисперсии ?2n по признаку
Выпуск продукции
Установить курсор в ячейку D84;
Вставка =>Функция;
Статистические => ДИСПР=>ОК;
Число1<= диапазон ячеек табл.1, содержащих значения второго признака.
Алгоритм 3.5. Расчет выборочного среднего линейного отклонения EMBED Equation.3 по
признаку
Среднегодовая стоимость основных производственных фондов
Установить курсор в ячейку В85;
Вставка =>Функция;
Статистические =>СРОТКЛ=>ОК;
Число1<= диапазон ячеек табл.1, содержащих значения первого признака.
Алгоритм 3.6. Расчет выборочного среднего линейного отклонения EMBED Equation.3 по признаку
Выпуск продукции
Установить курсор в ячейку D85;
Вставка =>Функция;
Статистические => СРОТКЛ =>ОК;
Число1<= диапазон ячеек табл.1, содержащих значения второго признака.
Алгоритм 3.7. Расчет коэффициента вариации EMBED Equation.3 по признаку
Среднегодовая стоимость основных производственных фондов
Установить курсор в ячейку В86;
В активизированную ячейку ввести формулу =B83/B48*100.
Алгоритм 3.8. Расчет коэффициента вариации EMBED Equation.3 по признаку
Выпуск продукции
Установить курсор в ячейку D86;
В активизированную ячейку ввести формулу =D83/D48*100.
Алгоритм 3.9. Расчет выборочного коэффициента асимметрии Пирсона Asп по признаку
Среднегодовая стоимость основных производственных фондов
Установить курсор в ячейку В87;
В активизированную ячейку ввести формулу =(B48-B51)/B83.
Алгоритм 3.10. Расчет выборочного коэффициента асимметрии Пирсона Asп по признаку
Выпуск продукции
Установить курсор в ячейку D87;
В активизированную ячейку ввести формулу =(D48-D51)/D83
В результате работы алгоритмов 3.1 - 3.10 Excel осуществляет вывод значений выборочных параметров ?n, ?2n, EMBED Equation.3 , EMBED Equation.3 и Аsn в соответствующие ячейки рабочего листа Табл.5.

Задание 3
Построение и графическое изображение интервального вариационного ряда распределения единиц совокупности по признаку
Среднегодовая стоимость основных производственных фондов
Для того, чтобы выявить структуру совокупности и тип закономерности распределения ее единиц по варьирующему признаку, строят и анализируют интервальный вариационный ряд распределения и его гистограмму.
Выполнение Задания 3 заключается в решении двух статистических задач:
1. Построение интервального ряда распределения единиц выборочной совокупности по признаку Среднегодовая стоимость основных производственных фондов.
2. Построение гистограммы и кумуляты сформированного интервального ряда.
Алгоритмы выполнения Задания 3
Выполнение задания осуществляется в три этапа:
Построение промежуточной таблицы.
Генерация выходной таблицы и графиков.
Приведение выходной таблицы и диаграммы к виду, принятому в статистике.
Этап 1. Построение промежуточной таблицы.
Алгоритм 1.1. Расчет нижних границ интервалов
Сервис =>Анализ данных =>Гистограмма =>ОК;
Входной интервал<= диапазон ячеек В4:В33;
Интервал карманов оставить незаполненным;
Выходной интервал <= адрес заголовка первого столбца первичной промежуточной табл.6 ( А90 ).
OK;
Алгоритм 1.2. Переход от нижних границ к верхним
Выделить курсором верхнюю левую ячейку табл.6 и нажать клавишу [Delete];
Ввести в ячейку с именем "Еще" значение хmax первого признака из табл.3-Описательные статистики.
Рис. 2. Схема перехода от нижних границ интервалов к верхним
Этап 2. Генерация выходной таблицы и графиков
Алгоритм 2.1. Построение выходной таблицы, столбиковой диаграммы и кумуляты.
Сервис=>Анализ данных=>Гистограмма=>ОК;
Входной интервал<= диапазон ячеек В4:В33;
Интервал карманов <= диапазон карманов итоговой промежуточной табл.6 с верхними границами ( А92:А96);
Выходной интервал <= адрес заголовка первого столбца выходной табл.7 ( А101 );
Интегральный процент - Активизировать;
Вывод графика - Активизировать;
ОК;
При появлении сообщения о наложении данных - ОК.
Выходная таблица имеет следующий вид:
Этап 3. Приведение выходной таблицы и диаграммы к виду, принятому в статистике.
Алгоритм 3.1. Преобразование выходной таблицы в результативную.
Заменить названия столбцов выходной табл.7;
Строки первого столбца привести к виду «нижняя граница интервала - верхняя граница интервала», учитывая совпадение верхних границ предыдущего интервала с нижней границей последующего интервала;
Строку с именем «Еще» выделить мышью и очистить, нажав клавишу [Delete];
Добавить и заполнить строку с именем «Итого».
Таблица 7. Интегральный ряд распределения после редактирования
Алгоритм 3.2. Преобразование столбиковой диаграммы в гистограмму.
Осуществив «захват мышью», переместить график, расположив его вслед за табл.7;
Исключить зазоры, выполнив следующие действия:
2.1. Нажать правую кнопку мыши на одном из столбиков диаграммы.;
2.2. Формат рядов данных=>Параметры;
2.3. Ширина зазора<= 0;
2.4. ОК;
3. Используя "захват мышью" за угол поля графика, установить соотношение ширины и высоты фигуры гистограммы в пропорции 1 : 0,62.
EMBED Excel.Chart.8 \s
Рис. 3. Гистограмма и кумулята

3. Выводы о статистических свойствах изучаемой совокупности
Статистический анализ выборочной совокупности
Задача 1.
Любая изучаемая совокупность может содержать единицы наблюдения, значения признаков которых резко выделяются из основной массы значений. Такие нетипичные значения признаков могут быть обусловлены воздействием каких-либо сугубо случайных обстоятельств, возникать в результате ошибок наблюдения или же быть объективно присущими наблюдаемому явлению. В любом случае они являются аномальными для совокупности, так как нарушают статистическую закономерность изучаемого явления. Следовательно, статистическое изучение совокупности без предварительного выявления и анализа возможных аномальных наблюдений может не только исказить значения обобщающих показателей (средней, дисперсии, среднего квадратического отклонения и др.), но и привести к серьезным ошибкам в выводах о статистических свойствах совокупности, сделанных на основе полученных оценок показателей.
Для выявления и исключения аномальных единиц наблюдения построена диаграмма рассеяния изучаемых признаков (Рис. 1). По результатам визуального анализа диаграммы рассеяние, построенной по исходным данным Табл. 1, были выявлены и зафиксированы в Табл. 2 аномальные значения признаков, которые затем были удалены из первичных данных. После удаления аномальных единиц наблюдения диаграмма рассеяния примет вид представленный на Рис.1. Количество аномальных единиц 2шт, Таблица 2.
Задача 2.
Построение и статистическое изучение вариационных рядов распределения выполняется на этапе априорного анализа совокупности. При этом для каждого изучаемого признака строится вариационный ряд распределения единиц совокупности по данному признаку и рассчитываются обобщающие статистические характеристики ряда – средняя, мода, медиана, показатели вариации признака и особенностей формы распределения. На их основе оцениваются устойчивость индивидуальных значений признака, надежность их среднего значения, степень вариации признака, устанавливается характер (тип) закономерности изменения частот в распределении и другие статистические свойства распределений, которые описаны ниже.
Рассчитанные выборочные показатели представлены в двух таблицах - табл.3 и табл.5. На основе этих таблиц формируется единая таблица (табл.8) значений выборочных показателей, перечисленных в условии Задачи 2, табл. 8 с заголовком «Описательные статистики выборочной совокупности»
Таблица 8
Описательные статистики выборочной совокупности

Задача 3.
а) степень колеблемости значений признаков в совокупности:
-для первого признака, коэффициент вариации равен 17,1910444, т.к
0%<17.19?40%, то колеблемость незначительна;
- для второго признака, коэффициент вариации равен 21,74952089, т.к
0%<21.75?40%, то колеблемость незначительна.
б)степень однородности совокупности по изучаемым признакам:
Для нормальных и близких к нормальному распределений показатель V? служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства
V? ? 33%, 17,19 ? 33% и 21,75 ? 33%
совокупность является количественно однородной по данным признакам.
в) устойчивость индивидуальных значений признаков:
Сопоставление средних отклонений – квадратического ? и линейного EMBED Equation.3 позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.
В условиях симметричного и нормального, а также близких к ним распределений между показателями ? и EMBED Equation.3 имеют место равенства
? EMBED Equation.3 1,25EMBED Equation.3, EMBED Equation.3 EMBED Equation.3 0,8?,
поэтому отношение показателей EMBED Equation.3 и ? может служить индикатором устойчивости данных: если
EMBED Equation.3 >0,8,
то значения признака неустойчивы, в них имеются «аномальные» выбросы.
? ? 1,25*114,8 ? 142,68; EMBED Equation.3 ? 0,8*142,68 ? 114,8 ;
т.к. неравенство EMBED Equation.3 >0,8 не выполняется, то первый признак устойчив.
? ? 1,25*131,12 ? 163,9; EMBED Equation.3 ? 0,8*170,2 ? 136,1;
т.к. неравенство EMBED Equation.3 >0,8 не выполняется, то второй признак устойчив.
г) количество попаданий индивидуальных значений признаков в диапазоны
( EMBED Equation.3 ), ( EMBED Equation.3 ), ( EMBED Equation.3 ):
По значениям показателей EMBED Equation.3 и ? можно определить границы диапазонов рассеяния значений признака относительно средней EMBED Equation.3 , т.е. установить, какая доля значений признака попадает в тот или иной диапазон отклонений от EMBED Equation.3 .
В нормально распределенных и близких к ним рядах вероятностные оценки диапазонов рассеяния значений признака таковы:
68,3% войдет в диапазон ( EMBED Equation.3 );
95,4% попадет в диапазон ( EMBED Equation.3 );
99,7% появится в диапазон ( EMBED Equation.3 )
Это соотношение известно как правило «трех сигм».
Таблица 9
Распределение значений признака по диапазонам
рассеяния признака относительно EMBED Equation.3

Процентное соотношение рассеяния значений признака по трем диапазонам составляет:
66,6% войдет в диапазон ( EMBED Equation.3 );
93,3% попадет в диапазон ( EMBED Equation.3 );
100% появится в диапазон ( EMBED Equation.3 )
что соответствует правилу «трех сигм».
Задача 4.
а) по вариации признаков:
Показатели вариации признака описывают степень рассеяния вариантов значений признака относительно своего центра EMBED Equation.3 (или Ме). Различают показатели размера и интенсивности вариации.
В статистической практике для оценки вариации наиболее широко применяются показатели размера вариации ?2, ? и показатель интенсивности вариации V?.
Показатели ?2, ?, основанные на учете отклонений (xi-EMBED Equation.3) индивидуальных значений признака xi от средней арифметической EMBED Equation.3, являются обобщающими характеристиками различия в значениях признака.
Дисперсия ?2 оценивает средний квадрат отклонений (xi -EMBED Equation.3). Величина ? очень чутко реагирует на вариацию признака (за счет возведения отклонений в квадрат) и органически вписывается в аппарат математической статистики (дисперсионный, корреляционный анализ и др.). На расчете дисперсии основаны многие статистические показатели.
Среднее квадратическое отклонение ? показывает, на сколько в среднем отклоняются индивидуальные значения признака xi от их средней величиныEMBED Equation.3.
В данном случае по первому признаку среднее квадратическое отклонение равно 142,69, а по второму равно 170,21.
Размерность отклонения ? совпадает с размерностью самого признака, поэтому этот показатель экономически хорошо интерпретируется. Отклонения, выраженные в ?, принято считать стандартными.
Интенсивность вариации обычно измеряют коэффициентом вариации V? , который выражается в процентах и вычисляется по формуле
EMBED Equation.3
Величина V? оценивает интенсивность колебаний вариантов относительно их средней величины. Принята следующая оценочная шкала колеблемости признака:
0%<V?40% - колеблемость незначительная;
40%< V?60% - колеблемость средняя (умеренная);
V?>60% - колеблемость значительная.
В нашем случае:
-для первого признака, коэффициент вариации равен 17,1910444, т.к
0%<17.19?40%,
то колеблемость незначительна;
- для второго признака, коэффициент вариации равен 21,74952089, т.к
0%<21.75?40%,
то колеблемость незначительна.
б) по количественной однородности единиц:
Количественная однородность совокупности – это близость числовых значений признаков, определяющих качественное содержание совокупности.
Однородность статистической совокупности означает, что все ее единицы обладают сходством по некоторому кругу признаков, обусловливающих качественную определенность совокупности, а количественные значения этих признаков оказываются близкими друг к другу.
в) по надежности (типичности) средних значений признаков:
Для оценка надежности (типичности) средней величины EMBED Equation.3 можно воспользоваться значением показателя вариации, V?. Если его значение невелико (в нашем случае оно меньше 40%), то индивидуальные значения признака xi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина EMBED Equation.3 является надежной характеристикой данной совокупности.
г) по симметричности распределений в центральной части ряда:
Показатели асимметрии оценивают смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.
В симметричном распределении максимальная ордината прямой располагается точно в середине кривой , а соответствующие ей характеристики центра распределения совпадают:
EMBED Equation.3=Mo=Me
В случае асимметричного распределения вершина кривой находится не в середине, а сдвинута либо влево, либо вправо.
Если вершина сдвинута влево, то правая часть кривой оказывается длиннее левой, т.е. имеет место правосторонняя асимметрия, характеризующаяся неравенством EMBED Equation.3>Me>Mo, что означает преимущественное появление в распределении более высоких значений признака.
Этому неравенству соответствует второй признак (Табл. 8).
Если же вершина кривой сдвинута вправо и левая часть оказывается длиннее правой, то асимметрия левосторонняя , для которой справедливо неравенство EMBED Equation.3<Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака.
Этому неравенству соответствует первый признак (Табл. 8)
Для оценки асимметричности распределения в этом центральном диапазоне служит коэффициент К.Пирсона.
При правосторонней асимметрии Asп>0, при левосторонней Asп<0. Если Asп=0, вариационный ряд симметричен.
В нашем случае первый признак меньше нуля, значит левосторонняя асимметрия, а второй признак больше нуля, значит правосторонняя асимметрия (Табл.8).
Задача 5.
Интервальный вариационный ряд представляет признак в виде упорядоченного набора интервалов значений признака с указанием для каждого интервала его частоты, фиксирующей число попаданий значений признака в данный интервал.
Интервальный ряд распределения предприятий по Стоимости основных производственных фондов представлен в Таблице 7.
Гистограмма распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов рис.3.
Мы определили (Задача 4, п. г) ), что вершина кривой сдвинута вправо и левая часть оказывается длиннее правой, то асимметрия левосторонняя , для которой справедливо неравенство EMBED Equation.3<Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака.
Показатель эксцесса характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой. Т.к. коэффициент эксцесса Ek меньше нуля, то наша кривая с плосковершинным распределением.
Гистограмма имеет одновершинную форму, есть основания предполагать, что выборка является однородной по данному признаку. Как мы определили (в Задаче 3, п. б) совокупность является количественно однородной по данному признаку.
Т.к. асимметрия небольшая, то относится к нормальному типу.
Для полученного интервального ряда значение моды Мо рассчитывается по формуле:
EMBED Equation.3,
где: хМо – нижняя граница модального интервала;
h – величина модального интервала;
fMo – частота модального интервала;
fMo-1 – частота интервала, предшествующего модальному;
fMo+1 – частота интервала, следующего за модальным.
Мо = 530 + 600 EMBED Equation.3 = 890
Это означает, что наиболее часто встречаемая величина признаков данной совокупности равна 890.
Анализ генеральной совокупности
Задача 1.
Таблица 10
Описательные статистики генеральной совокупности
В математической статистике доказано, что при малом числе наблюдений (особенно при nEMBED Equation.340-50) для вычисления генеральной дисперсии ?2N по выборочной дисперсии ?2n следует использовать формулу
EMBED Equation.3
EMBED Equation.3 = 21693,36 EMBED Equation.3 = 30870,2
Степень расхождения между EMBED Equation.3 незначительна.
Для нормального распределения справедливо равенство
R=6?
R = 6 * 142.68 = 856.08 R = 6 * 170.2 = 1021.2
Задание 2.
а) рассчитать среднюю ошибку выборки;
Средние ошибки выборки рассчитаны и приведены в табл.3 (параметр Стандартная ошибка).
Для первого признака она равна 26,496, для второго 31,608.
б) рассчитать предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
Таблица 11
Предельные ошибки выборки и ожидаемые границы
для генеральных средних
В математической статистике доказано, что предельная ошибка выборки EMBED Equation.3 кратна средней ошибке EMBED Equation.3 с коэффициентом кратности t, зависящим от значения доверительной вероятности P:
EMBED Equation.3=EMBED Equation.3
Величина коэффициента t (называемого также коэффициентом доверия) является нормированным отклонением.
Предельная ошибка выборки EMBED Equation.3 позволяет определить предельные значения показателей генеральной совокупности и их доверительные интервалы. Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:
EMBED Equation.3,
EMBED Equation.3
Рассмотрим для примера первый признак с доверительной вероятностью 0,683:
EMBED Equation.3= 1 * 26,496 = 26,496.
EMBED Equation.3830±26,496
803,504?EMBED Equation.3?856,496
Задача 3.
Значения коэффициентов асимметрии As и эксцесса Ek имеются в табл.10.
Распределение единиц выборочной совокупности близко к нормальному, выборка является репрезентативной (значение показателей ?N2 и ?n2 расходятся незначительно) и при этом коэффициенты AsN, EkN указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно, то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.