EMBED MSPhotoEd.3
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
Инструкция
по выполнению лабораторных работ
Москва, 2008 г.
Лабораторная работа №1
Автоматизированный априорный анализ статистической совокупности в среде MS Excel
Задание 1. Выявление и удаление из выборки аномальных единиц наблюдения.
Задание 2. Оценка описательных статистических параметров совокупности.
Задание 3. Построение и графическое изображение интервального вариационного ряда распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов.
1. Подготовительный этап
На данном этапе студент должен проделать следующие обязательные действия, связанные с организацией индивидуальной рабочей среды:
подготовить персональную папку с Рабочим и Отчетным файлами;
сформировать индивидуальный вариант исходных данных и записать его в Отчетный файл;
Подготовка персональной папки студента с Рабочим и Отчетным файлами
Для выполнения расчетов обобщающих показателей и подготовки отчета по лабораторной работе студент формирует персональную папку с именем ФИО, содержащую два файла: Рабочий с именем Лаб.хls и Отчетный с именем Отчет.doc.
Для этого необходимо выполнить следующие действия:
а) создание персональной папки и Рабочего файла:
Для создания рабочего файла проделать следующие действия:
Загрузить файл с исходными данными и макетами таблиц по следующему алгоритму:
На рабочем столе открыть «Общая папка студентов»
Открыть файл: Преподаватели \ Кафедра статистики \ Априорный анализ \ stat_lab_new.
2. Сохранить файл с исходными данными в качестве рабочего файла по алгоритму:
В меню Файл =>Сохранить как…
В диалоговом окне Сохранение документа выбрать путь: Общая папка студентов \ Работы студентов \ _СТАТИСТИКА \
Выбрать пиктограмму «Создать папку» и в появившимся диалоговом окне записать в поле «Имя» свою фамилию.
3. Сохранить файл в созданной папке под именем Лаб. хls.
4. ЗАПРЕЩАЕТСЯ СОХРАНЯТЬ ФАЙЛ В КОРНЕ «Общая папка студентов», т.к. файлы будут удалены!!! Помните, что сетевой ресурс «Общая папка студентов» является местом временного хранения файлов!!!
б) создание Отчетного файла:
Загрузить файл, содержащий стандартизированный формат отчета из директории
На рабочем столе открыть «Общая папка студентов»
Открыть файл: Преподаватели \ Кафедра статистики \ Априорный анализ \ ОТЧЕТ (шаблон).
2. Сохранить файл по алгоритму:
В меню Файл =>Сохранить как…
В диалоговом окне Сохранение документа выбрать путь: Общая папка студентов \ Работы студентов \ _СТАТИСТИКА \
Выбрать пиктограмму «Создать папку» и в появившимся диалоговом окне записать в поле «Имя» свою фамилию.
Сохранить файл в созданной папке под именем отчет.
Формирование индивидуальных исходных данных
Номер варианта исходных данных соответствует номеру варианта в курсовой работе.
Для того, чтобы сформировать индивидуальные исходные данные, необходимо ввести номер варианта в ячейку E2 созданного Рабочего файла Лаб.хls, в результате чего Excel сформирует исходные данные варианта.
Структура Листа 1 Рабочего файла stat_lab.xls
(распределение памяти для результативных таблиц)
…
2. Этап выполнения статистических расчетов
Задание 1
Выявление и удаление из выборки аномальных единиц наблюдения
Первичные данные выборочной совокупности могут содержать аномальные значения изучаемых признаков (см. в методических указаниях [1] п. 2 раздела II – «Теоретические основы лабораторной работы»). Задание 1 заключается в их выявлении и исключении из дальнейшего рассмотрения с целью обеспечения устойчивости данных статистического исследования.
Выполнение Задания 1 заключается в решении двух задач:
Построение диаграммы рассеяния изучаемых признаков.
.Визуальный анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков, их удаление из первичных данных.
Алгоритмы выполнения Задания 1
Задача 1. Построение диаграммы рассеяния изучаемых признаков.
Алгоритм 1.1. Построение диаграммы рассеяния изучаемых признаков
Выделить мышью исходные данные (B4:C35);
Вставка=>Диаграмма=>Точечная=>Готово.
В результате выполнения указанных действий появляется диаграмма рассеяния исследуемых признаков.
EMBED PBrush Рис. 1. Аномальные значения признаковна диаграмме рассеяния.
Задача 2. Визуальный анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков, их удаление из первичных данных.
Алгоритм 2. Визуальный анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков, их удаление из первичных данных
Найти на графике точку, соответствующую аномальному наблюдению. Если таких точек нет, то перейти к действию 7, если есть – к действиям 2–6.
Подвести курсор к точке на диаграмме рассеяния, соответствующей аномальному наблюдению. После непродолжительного времени возле точки автоматически появится надпись, содержащая значения признаков (xi,yi) этого наблюдения.
EMBED PBrush Для демонстрационного примера такая надпись выглядит следующим образом:
В исходных данных визуально найти в табл.1 строку, соответствующую выявленной аномальной единице наблюдения (предприятию) и скопировать её в табл.2.
Выделить мышью всю адресную строку (вместе с ее номером) с данными, подлежащими удалению.
Для демонстрационного примера это адресная строка с номером 34, содержащая значения 31, 330 и 53:
Правка=>Удалить.
Выполнять действия 1–5 до полного удаления всех аномальных значений признаков.
Выделить диаграмму рассеяния и переместить ее, используя прием "захват мышью", в область ячеек, начиная с ячейки F4.
Для демонстрационного примера табл.2, содержащая две единицы наблюдения с аномальными значениями признаков, имеет следующий вид.
Задание 2
Оценка описательных статистических параметров
совокупности
Обобщающие статистические показатели совокупности исчисляются на основе анализа вариационных рядов распределения (см. в методических указаниях [1] п.3 раздела II – «Теоретические основы лабораторной работы»). Однако пакет Excel позволяет рассчитать многие из этих показателей непосредственно по первичным данным наблюдения, используя инструмент Описательная статистика надстройки Пакет анализа, а также статистические функции инструмента Мастер функций.
Выполнение Задания 2 заключается в автоматизированном решении двух статистических задач:
Расчет описательных показателей выборочной и генеральной совокупностей по несгруппированным выборочным данным с использованием инструментов Описательная статистика и Мастер функций.
Оценка средней и предельной ошибок выборки для средней величины признака, а также границ, в которых эта средняя будет находиться в генеральной совокупности при заданных уровнях надежности.
Алгоритмы выполнения Задания 2
Выполнение задания включает три этапа:
Расчет описательных параметров выборочной и генеральной совокупностей с использованием инструмента Описательная статистика.
Оценка предельных ошибок выборки для различных уровней надежности в режиме Описательная статистика.
Расчет описательных параметров выборочной совокупности с использованием инструмента Мастер функций.
Этап 1. Расчет описательных параметров выборочной и генеральной совокупностей с использованием инструмента Описательная статистика
Алгоритм 1.1. Расчет описательных статистик
Сервис=>Анализ данных=>Описательная статистика=>OK;
Входной интервал<= диапазон ячеек таблицы, выделенный для значений признаков Стоимость основных фондов и Выпуск продукции (B4:С33);
Группирование =>по столбцам;
Итоговая статистика - Активизировать;
Уровень надежности - Активизировать;
Уровень надежности <= 95,4 (или 95.4);
Выходной интервал <= адрес ячейки заголовка первого столбца табл.3 (А46);
OK;
При появлении окна с сообщением "Выходной интервал накладывается на имеющиеся данные" =>ОК.
Результат работы алгоритма 2.1 для демонстрационного примера представлен в табл.3–ДП.
Этап 2. Оценка предельных ошибок выборки для различных уровней надежности в режиме Описательная статистика.
Алгоритм 2.1. Расчет предельной ошибки выборки при P=0,683
Сервис=>Анализ данных=>Описательная статистика=>OK;
Входной интервал<= диапазон ячеек таблицы, выделенный для значений признаков Стоимость основных фондов и Выпуск продукции (В4:С33);
Итоговая статистика – НЕ активизировать (снять флажок);
Уровень надежности – Активизировать;
Уровень надежности<= 68,3 (или 68.3);
Выходной интервал <= адрес ячейки, выделенной для предельной ошибки выборки при P=0,683 (А67);
OK;
При появлении окна с сообщением "Выходной интервал накладывается на имеющиеся данные" =>ОК.
Результат работы алгоритма 2.1 для демонстрационного примера представлен в табл.4–ДП.
Этап 3. Расчет описательных параметров выборочной совокупности с использованием инструмента Мастер функций
Алгоритм 3.1. Расчет значений выборочных параметров EMBED Equation.3
Вычисление показателей для обоих признаков осуществляется с использованием соответствующих статистических функций СТАНДОТКЛОНП, ДИСПР, СРОТКЛ инструмента Мастер функций. В макете табл.5. приведены их имена вместе с адресами аргументов.
В ячейках (В83 – В84), выделенных для значений выборочных показателей признака Среднегодовая стоимость основных производственных фондов:
1.1. Перед именами функций поставить знак равенства «=»;
1.2. Enter;
В ячейках (D83 – D84), выделенных для значений выборочных показателей признака Выпуск продукции:
2.1. Перед именами функций поставить знак равенства «=»;
2.2. Enter;
Алгоритм 3.2. Расчет коэффициентов вариации EMBED Equation.3 для обоих признаков
В макете табл.5. приведены расчетные формулы коэффициента вариации EMBED Equation.3 .
В ячейке В85, выделенной для значений коэффициента вариации по признаку Среднегодовая стоимость основных производственных фондов, перед формулой поставить знак равенства «=»;
Enter;
В ячейке D85, выделенной для значений коэффициента вариации по признаку Выпуск продукции, перед формулой поставить знак равенства «=»;
Enter.
В результате работы алгоритмов 3.1-3.2 осуществляется вывод выборочных параметров EMBED Equation.3 и EMBED Equation.3 в соответствующие ячейки рабочего листа (для демонстрационного примера табл.5–ДП).
Задание 3
Построение и графическое изображение интервального вариационного ряда распределения единиц совокупности по признаку
Среднегодовая стоимость основных производственных фондов
Для того чтобы выявить структуру совокупности и тип закономерности распределения ее единиц по варьирующему признаку, строят и анализируют интервальный вариационный ряд распределения и его гистограмму (см. в методических указаниях [1] п. 3 раздела II – Теоретические основы лабораторной работы).
Выполнение Задания 3 заключается в решении двух статистических задач:
Построение интервального ряда распределения единиц выборочной совокупности по признаку Среднегодовая стоимость основных производственных фондов.
Построение гистограммы и кумуляты сформированного интервального ряда.
Алгоритмы выполнения Задания 3
Выполнение задания осуществляется в три этапа:
Построение промежуточной таблицы.
Генерация выходной таблицы и графиков.
Приведение выходной таблицы и диаграммы к виду, принятому в статистике.
Этап 1. Построение промежуточной таблицы.
Алгоритм 1.1. Расчет нижних границ интервалов
Сервис=>Анализ данных=>Гистограмма=>ОК;
Входной интервал<= диапазон ячеек, выделенный для столбца значений первого признака (В4:В33);
Внимание! Здесь возможен ошибочный захват мышью столбца второго признака. Необходимо проконтролировать правильность задания входных данных!
Интервал карманов оставить незаполненным;
Выходной интервал <= адрес заголовка первого столбца первичной промежуточной табл.6 (А90);
OK.
Алгоритм 1.2. Переход от нижних границ к верхним
Выделить курсором верхнюю левую ячейку табл.6 (A91) и нажать клавишу [Delete];
Ввести в последнюю ячейку табл.6 (A96) вместо "Еще" значение хmax первого признака из табл.3 – Описательные статистики (Термин "Максимум").
Для демонстрационного примера построение промежуточной таблицы (алгоритмы 1.1 – 1.2) приведено на рис.2:
Рис.2. Схема перехода от нижних границ интервалов к верхним
Этап 2. Генерация выходной таблицы и графиков
Алгоритм 2.1. Построение выходной таблицы, столбиковой диаграммы и кумуляты
Сервис=>Анализ данных=>Гистограмма=>ОК;
Входной интервал<= диапазон ячеек, выделенный для столбца значений первого признака (В4:В33);
Внимание! Здесь возможен ошибочный захват мышью столбца второго признака. Необходимо проконтролировать правильность задания входных данных!
Интервал карманов <= диапазон карманов итоговой промежуточной табл.6 с верхними границами (А92:А96);
Выходной интервал <= адрес заголовка («Карман») первого столбца выходной табл.7 (А102);
Интегральный процент – Активизировать;
Вывод графика – Активизировать;
ОК;
При появлении сообщения о наложении данных – ОК.
Для демонстрационного примера выходная таблица имеет следующий вид:
Столбиковая диаграмма и кумулята приведены ниже:
EMBED Excel.Chart.8 \s
Этап 3. Приведение выходной таблицы и диаграммы к виду, принятому в статистике.
Алгоритм 3.1. Преобразование выходной таблицы в результативную
Строку 102, содержащую термин «Карман», выделить мышью (вместе с ее номером);
Правка => Удалить;
Строку 107, содержащую термин «Еще», выделить мышью и очистить, нажав клавишу [Delete];
Строки первого столбца привести к виду «нижняя граница интервала - верхняя граница интервала», учитывая совпадение верхних границ предыдущего интервала с нижней границей последующего интервала (нижняя граница первого интервала равна хmin первого признака из табл.3 – Описательные статистики – Термин "Минимум").
Добавить и заполнить итоговую строку 108 (ячейки А108:В108).
Для демонстрационного примера Excel-формат результативной таблицы выглядит следующим образом.
Алгоритм 3.2. Преобразование столбиковой диаграммы в гистограмму
Осуществив «захват мышью», переместить график, расположив его вслед за табл.7.
Исключить зазоры, выполнив следующие действия:
Нажать правую кнопку мыши на одном из столбиков диаграммы;
Формат рядов данных=>Параметры;
Ширина зазора<= 0;
ОК;
Подвести курсор на угол поля графика и, используя прием "захват мышью", установить визуально соотношение ширины и высоты фигуры гистограммы в пропорции 1 : 0,6.
Внимание! Здесь возможна ошибочная установка указанной пропорции для размеров поля графика, а не для самой геометрической фигуры гистограммы. Необходимо проконтролировать правильность установки пропорции ширины и высоты фигуры гистограммы.
По окончании работы алгоритма 3.2 выполнить настройку диаграммы:
Изменить название осей (алгоритм 3.3);
Изменить текст легенды (алгоритм 3.4).
Алгоритм 3.3. Изменение названия осей
Выделить мышью построенную диаграмму;
Диаграмма => Параметры диаграммы;
В появившемся диалоговом окне Параметры диаграммы выбрать вкладку Заголовки и в поле Ось Х ввести заголовок оси – "Среднегодовая стоимость основных производственных фондов", а в поле Ось Y – "Число предприятий в группе";
ОК.
Алгоритм 3.4. Изменение текста легенды
Выделить мышью построенную диаграмму;
Диаграмма => Исходные данные;
В появившемся диалоговом окне Исходные данные выбрать вкладку Ряд, в поле Ряд выбрать заголовок "Интегральный %" и в поле Имя ввести – "Накопленная частость ";
ОК.
Для демонстрационного примера гистограмма и кумулята выглядят следующим образом
EMBED Excel.Chart.8 \s
Лабораторная работа № 2
Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel
Построение аналитической группировки для выявления корреляционной зависимости результативного признака от факторного и оценка тесноты взаимосвязи признаков.
Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.
Построение однофакторных нелинейных регрессионных моделей связи признаков с помощью инструмента Мастер диаграмм и выбор наиболее адекватного нелинейного уравнения регрессии.
Для выполнения ЛР-2 выделяется Лист 2 Рабочего файла, сформированного в персональной папке студента при выполнении ЛР-1, и используется следующая информация из ЛР-1 (Лист 1 Рабочего файла):
исходные данные – Таблица 1 (А4:С33), полученная после удаления аномальных значений признаков);
интервальный ряд распределения единиц совокупности по факторному признаку Х – Среднегодовая стоимость основных производственных фондов, представленный табл. 7 (А102:В106);
диаграмма рассеяния признаков, расположенная начиная с ячейки F4.
Компьютерное выполнение ЛР-2 включает два этапа:
Подготовительный этап.
Этап выполнения статистических расчетов.
1. Подготовительный этап
На Листе 2 Рабочего файла персональной папки студента при выполнении ЛР-1 были заготовлены макеты результативных таблиц, используемые в ЛР-2.
На данном этапе студент должен скопировать необходимую информацию ЛР-1 из Листа 1 в Лист 2 Рабочего файла персональной папки в соответствии с нижеследующей таблицей:
Лист 1 Лист 2
>Внимание! Табл.7 копируется на Лист 2 Рабочего файла дважды!
По окончании копирования информации ЛР-1 необходимо ознакомиться с распределением памяти Листа 2, выделенной для результативных таблиц с тем, чтобы систематически проверять на этапах ЛР-2 правильность адресации получаемых результативных таблиц. При этом во избежание ошибок содержание каждой получаемой результативной таблицы следует сопоставлять с соответствующими таблицами демонстрационного примера.
Структура Листа 2 Рабочего файла stat_lab.xls
(распределение памяти для результативных таблиц)
…
2. Этап выполнения статистических расчетов
Задание 1
Построение аналитической группировки для выявления корреляционной зависимости результативного признака от факторного и оценка тесноты взаимосвязи признаков
Выполнение Задания 1 заключается в решении следующих двух задач:
Задача 1. Построение аналитической группировки предприятий по факторному признаку Х – Среднегодовая стоимость основных производственных фондов.
Задача 2. Оценка тесноты связи изучаемых признаков на основе эмпирического корреляционного отношения.
Алгоритмы выполнения Задания 1
Задача 1. Построение аналитической группировки предприятий по признаку Среднегодовая стоимость основных производственных фондов.
Задача решается в три этапа:
Ранжирование единиц совокупности по возрастанию факторного признака Х – Среднегодовая стоимость основных производственных фондов – алгоритм 1.1.
Распределение предприятий по группам в соответствии с интервальным рядом распределения факторного признака – алгоритм 1.2.
Расчет суммарных и средних групповых значений результативного признака Y – Выпуск продукции – алгоритмы 1.3 и 1.4.
Алгоритм 1.1. Ранжирование исходных данных по факторному признаку
Выделить исходные данные (вместе с заголовком) табл. 2.1 (А3:С33);
Данные => Сортировка;
Сортировать по <= заголовок столбца, по которому выполняется сортировка, т.е. Среднегодовая стоимость основных производственных фондов;
По возрастанию/по убыванию – устанавливается в положение по возрастанию;
Затем и В последнюю очередь по – НЕ активизировать;
Идентифицировать поля по подписям/обозначениям столбцов листа – устанавливается в положение подписям;
ОК.
В результате указанных действий в таблице 2.1 размещаются данные, ранжированные по возрастанию признака Среднегодовая стоимость основных производственных фондов.
Алгоритм 1.2. Выделение групп предприятий с помощью заливки контрастным цветом
Из всего диапазона отсортированных данных A4:C33 выделить мышью диапазон ячеек первой группы, для чего необходимо отсчитать в ранжированном ряду количество строк, соответствующее числу предприятий первой группы (графа 3 табл.2.2);
Нажать на панели инструментов кнопку для выбора цвета заливки;
Выбрать цвет заливки по собственному усмотрению;
>Внимание! Цвет желательно брать контрастный, чтобы четко отделить одну группу от другой.
Выполнить действия 1–3 для всех групп, выбирая контрастные цвета для цветовой заливки очередной группы.
Результаты работы алгоритмов 1.1 и 1.2 для демонстрационного примера представлены в табл.2.1–ДП.
Алгоритм 1.3. Расчет суммарных групповых значений результативного признака
В ячейке (D41), выделенной для суммарного значения результативного признака Выпуск продукции первой группы, перед формулой поставить знак равенства «=»;
В качестве аргумента функции СУММ() указать диапазон ячеек из табл. 2.1 с результативными значениями уi первой группы (визуально легко определяется по цвету заливки диапазона);
>Внимание! Здесь возможен ошибочный захват мышью столбца значений первого (факторного) признака Х. Необходимо проконтролировать правильность задания аргумента функции СУММ().
Enter;
Выполнить действия 1–3 поочередно для всех групп, используя цветовые заливки диапазонов.
Алгоритм 1.4. Расчет средних групповых значений результативного признака
В таблице 2.2 приведены формулы для расчета средних групповых значений результативного признака Выпуск продукции.
В ячейке (Е41), выделенной для среднего значения результативного признака Выпуск продукции первой группы, перед формулой поставить знак равенства «=»;
Enter;
Выполнить действия 1–2 поочередно для всех групп;
В ячейках (C46, D46 и E46), выделенных для расчета итоговых сумм:
Перед формулой поставить знак равенства «=»;
Enter.
Результаты работы алгоритмов 1.3 и 1.4 для демонстрационного примера приведены в табл. 2.2–ДП.
Задача 2. Оценка тесноты связи изучаемых признаков на основе эмпирического корреляционного отношения
Задача решается в два этапа:
Расчет внутригрупповых дисперсий результативного признака.
Расчет эмпирического корреляционного отношения.
Алгоритм 2.1. Расчет внутригрупповых дисперсий результативного признака
В ячейке, выделенной для внутригрупповых дисперсий первой группы (D52), перед формулой поставить знак равенства «=»;
В качестве аргумента функции ДИСПР() указать диапазон ячеек из табл. 2.1 со значениями yi первой группы – визуально легко определяется по цвету заливки диапазона;
>Внимание! Здесь возможен ошибочный захват мышью столбца значений первого (факторного признака) Х. Необходимо проконтролировать правильность задания аргумента функции ДИСПР().
Enter;
Выполнить действия 1–3 поочередно для всех групп, используя цветовые заливки диапазонов.
Для расчета итоговой суммы в табл. 2.3 (в ячейке C57) перед формулой необходимо поставить знак равенства «=»;
Enter.
Результат работы алгоритма 2.1 для демонстрационного примера представлен в табл.2.3–ДП.
Алгоритм 2.2. Расчет эмпирического корреляционного отношения
В ячейке, выделенной для общей дисперсии (А63), перед формулой поставить знак равенства «=»;
Enter;
В ячейке, выделенной для средней из внутригрупповых дисперсий (В63), перед формулой поставить знак равенства «=»;
Enter;
>Примечание. В случае если при выполнении вычисления в ячейке В63 выдается сообщение "Ошибка в формуле", то разделительный знак «,» между аргументами функции СУМПРОИЗВ(Д1,Д2) необходимо заменить на знак «;».
В ячейке, выделенной для значения межгрупповой (факторной) дисперсии (С63), перед формулой поставить знак равенства «=»;
Enter;
В ячейке, выделенной для эмпирического корреляционного отношения (D63), перед формулой поставить знак равенства «=»;
Enter.
Результат работы алгоритма 2.2 для демонстрационного примера представлен в табл.2.4–ДП.
Задание 2
Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа
Алгоритм выполнения Задания 2
Алгоритм 1. Расчет параметров уравнения линейной регрессии и проверки адекватности модели исходным данным
Сервис => Анализ данных => Регрессия => ОК;
Входной интервал Y <= диапазон ячеек таблицы со значениями признака Y – Выпуск продукции (С4:С33);
Входной интервал X – диапазон ячеек таблицы со значениями признака X – Среднегодовая стоимость основных производственных фондов (В4:В33);
Метки в первой строке/Метки в первом столбце – НЕ активизировать;
Уровень надежности <= 68,3 (или 68.3);
Константа–ноль – НЕ активизировать;
Выходной интервал <= адрес ячейки заголовка первого столбца первой выходной результативной таблицы (А75);
Новый рабочий лист и Новая рабочая книга – НЕ активизировать;
Остатки – Активизировать;
Стандартизованные остатки – НЕ активизировать;
График остатков – НЕ активизировать;
График подбора – НЕ активизировать;
График нормальной вероятности – НЕ активизировать;
ОК.
В результате указанных действий осуществляется вывод четырех выходных таблиц на Лист 2 Рабочего файла, начиная с ячейки, указанной в поле Выходной интервал диалогового окна инструмента Регрессия (для демонстрационного примера они имеют следующий вид).
Задание 3
Построение однофакторных нелинейных регрессионных моделей связи признаков с помощью инструмента Мастер диаграмм и выбор наиболее адекватного нелинейного уравнения регрессии
Алгоритмы выполнения Задания 3
Алгоритм 1. Построение уравнений регрессионных моделей для различных видов нелинейной зависимости признаков с использованием средств инструмента Мастер диаграмм
Выделить мышью диаграмму рассеяния признаков, расположенную начиная с ячейки Е4, и увеличить диаграмму на весь экран, используя прием "захват мышью";
Диаграмма => Добавить линию тренда;
В появившемся диалоговом окне Линия тренда выбрать вкладку Тип и задать вид регрессионной модели – полином 2-го порядка;
Выбрать вкладку Параметры и выполнить действия:
Переключатель Название аппроксимирующей кривой: автоматическое/другое – установить в положение другое и ввести имя тренда– полином 2-го порядка;
Поле Прогноз вперед на – НЕ активизировать;
Поле Прогноз назад на – НЕ активизировать;
Флажок Пересечение кривой с осью Y в точке –
НЕ активизировать;
Флажок Показывать уравнение на диаграмме – Активизировать;
Флажок Поместить на диаграмму величину достоверности аппроксимации R2 – Активизировать;
ОК;
Установить курсор на линию регрессии и щелкнуть правой клавишей мыши;
В появившемся диалоговом окне Формат линии тренда выбрать по своему усмотрению тип, цвет и толщину линии;
ОК;
Выделить уравнение регрессии и индекс детерминации R2 и с помощью приема "захват мышью" вынести их за корреляционное поле. При необходимости уменьшить размер шрифта.
Действия 2 – 4 (в п.4 шаги 1–11) выполнить поочередно для следующих видов регрессионных моделей:
– полином 3-го порядка,– степенная функция.
По окончании работы алгоритма 1 выполнить следующие действия:
Присвоить полученной диаграмме заголовок "Диаграмма 2.1" и удалить линии сетки по оси Y (алгоритм 2);
Снять заливку области построения (алгоритм 3);
При необходимости изменить масштаб шкалы осей диаграммы (алгоритм 4).
Алгоритм 2. Присвоение полученной диаграмме заголовка "Диаграмма 2.1" и удаление линий сетки по оси Y
Выделить мышью построенную диаграмму;
Диаграмма => Параметры диаграммы;
В появившемся диалоговом окне Параметры диаграммы выбрать вкладку Заголовки и в поле Название диаграммы ввести заголовок диаграммы "Диаграмма 2.1";
Выбрать вкладку Линии сетки, в полях Ось Х и Ось Y все флажки – Не активизировать;
ОК.
Алгоритм 3. Снятие заливки области построения
Выделить мышью Область построения диаграммы;
Формат => Выделенная область построения;
В появившемся диалоговом окне Формат области переключатель Заливка установить в положение Обычная;
ОК.
Алгоритм 4. Изменение масштаба шкалы осей диаграммы
Выделить на полученной диаграмме ось, для которой необходимо изменить масштаб (подвести курсор к требуемой оси и щелкнуть левой клавишей мыши);
Формат => Выделенная ось;
В появившемся диалоговом окне Формат оси выбрать вкладку Шкала;
В поле Минимальное значение – ввести минимальное (или несколько ниже) значение признака, соответствующего форматируемой оси;
В поле Максимальное значение – ввести максимальное (или несколько выше) значение признака, соответствующего форматируемой оси;
ОК.
Выделить диаграмму и с помощью приема "захват мышью" переместить ее в конец Рабочего файла.
В результате указанных действий для выбранных видов моделей регрессии осуществляется вывод на диаграмму рассеяния 3-х уравнений регрессии, их графиков и значений соответствующих индексов детерминации R2 (для демонстрационного примера Диаграмма 2.1–ДП приведена на рис. 2.1).
EMBED Excel.Chart.8 \s Рис 2.1. Уравнения регрессии и их графики
Лабораторная работа № 3
Автоматизированный анализ динамики социально-экономических явлений в среде MS Excel
I. Постановка задачи
В процессе статистического изучения деятельности одного из предприятий получены данные о годовом выпуске продукции (в стоимостном выражении) за шестилетний период, а также данные о выпуске продукции по месяцам за 6-ой год.
Полученные два ряда динамики представлены в формате электронных таблиц процессора Excel, годовые данные - в диапазоне ячеек A6:B12, а данные за 6-ой год по месяцам - в диапазоне D6:E19. Для демонстрационного примера (ДП) данные о выпуске продукции приведены в табл. 3.1-ДП.
Таблица 3.1-ДП
Исходные данные демонстрационного примера
В процессе автоматизированного анализа динамики выпуска продукции за шестилетний период необходимо решить следующие статистические задачи.
Задание 1. Расчёт и анализ показателей ряда динамики выпуска продукции за шестилетний период.
Задание 2. Прогноз показателя выпуска продукции на 7-ой год методом экстраполяции.
Задание 3. Выявление тенденции развития изучаемого явления (тренда) по данным о выпуске продукции по месяцам за 6-ой год методами скользящей средней и аналитического выравнивания.
II. Порядок выполнения лабораторной работы
1. Подготовительный этап
Для выполнения Лабораторной работы №3 (ЛР3) выделяется Лист 3 Рабочего файла, сформированного в персональной папке студента при выполнении ЛР1.
На данном этапе студент должен записать в Отчетный файл ЛР3 индивидуальный вариант исходных данных.
На Листе 3 Рабочего файла персональной папки студента заготовлены макеты таблиц, используемые при выполнении ЛР3.
Расположение исходных данных и макетов результативных таблиц в Рабочем файле на Листе 3 персональной папки студента
2. Этап выполнения статистических расчетов
Задание 1.
Расчёт и анализ показателей ряда динамики выпуска продукции за шестилетний период.
Выполнение Задания 1 заключается в решении двух задач:
Задача 1. Расчет цепных и базисных показателей динамики: абсолютный прирост (сокращение); темп роста (снижения); темп прироста (сокращения) и абсолютное значение 1 % прироста.
Задача 2. Расчет средних показателей ряда динамики: средний уровень ряда динамики; средний абсолютный прирост; средний темп роста и средний темп прироста.
Алгоритмы выполнения Задания 1
Задача 1. . Расчет цепных и базисных показателей динамики: абсолютный прирост (сокращение); темп роста (снижения); темп прироста (сокращения) и абсолютное значение 1 % прироста
Алгоритм 1.1. Расчёт цепных и базисных показателей динамики, характеризующих изменение отдельных уровней ряда динамики
В ячейке, выделенной для значения абсолютного прироста цепного за первый год (С26), перед формулой поставить знак равенства «=»;
Enter;
Установить курсор в правом нижнем углу ячейки (С26) с формулой – образцом (курсор примет форму черного крестика) и, удерживая левую клавишу мыши в нажатом состоянии, переместить курсор до нижней клетки графы. Отпустить клавишу мыши (формула – образец размножилась на всю графу).
Выполнить действия 1–2 поочередно для всех аналитических показателей ряда динамики табл.3.2:
абсолютного прироста базисного;
темпа роста цепного и базисного;
темпа прироста цепного и базисного;
абсолютного значения 1% прироста.
Результат работы алгоритма 1.1 для демонстрационного примера приведены в табл. 3.2–ДП.
Задача 2. Расчет средних показателей ряда динамики: средний уровень ряда динамики; средний абсолютный прирост; средний темп роста и средний темп прироста
Алгоритм 1.2. Расчёт средних показателей ряда динамики
В ячейке, выделенной для значения средний уровень ряда динамики (E34), перед формулой поставить знак равенства «=»;
Enter;
Выполнить действия 1–2 поочередно для всех средних показателей ряда динамики табл.3.3:
среднего абсолютного прироста;
среднего темпа роста;
среднего темпа прироста.
Результат работы алгоритма 1.2 для демонстрационного примера приведены в табл. 3.3–ДП.
Задание 2.
Прогноз показателя выпуска продукции на 7-ой год методом экстраполяции.
Выполнение Задания 2 заключается в решении двух задач:
Задача 1. Прогнозирование выпуска продукции предприятием на год вперёд с использованием среднего абсолютного прироста и среднего темпа роста.
Задача 2. Прогнозирование выпуска продукции предприятием на год вперёд с использованием аналитического выравнивания ряда динамики по прямой, параболе и полиному 3-го порядка.
Алгоритмы выполнения Задания 2
Задача 1. Прогнозирование выпуска продукции предприятием на год вперёд с использованием среднего абсолютного прироста и среднего темпа роста.
Алгоритм 2.1. Расчёт выпуска продукции на год вперёд с использованием среднего абсолютного прироста и среднего темпа роста
В ячейке, выделенной для значений прогнозируемого выпуска продукции по среднему абсолютному приросту (Е41), перед формулой поставить знак равенства «=».
Enter;
Выполнить действия 1–2 для прогнозируемого выпуска продукции по значению среднего темпа роста (табл.3.4).
Результат работы алгоритма 2.1 для демонстрационного примера приведен в табл. 3.4 – ДП.
Задача 2. Прогнозирование выпуска продукции предприятием на год вперёд с использованием аналитического выравнивания ряда динамики по прямой, параболе и полиному 3-го порядка.
Алгоритм 2.2. Построение графика динамики выпуска продукции за 6 лет с использованием средств инструмента МАСТЕР ДИАГРАММ
Выделить мышью ячейки, содержащие выпуск продукции за 6 лет (диапазон ячеек B7:B12);
Вставка=>Диаграмма=>Точечная;
В появившемся диалоговом окне Мастер диаграмм (шаг 1 из 4) выбрать вид точечной диаграммы, на которой значения соединены отрезками;
Далее;
В появившемся диалоговом окне Мастер диаграмм (шаг 2 из 4) выбрать вкладку Ряд и задать имя ряда 1 – «Исходные данные»;
Далее;
В появившемся диалоговом окне Мастер диаграмм (шаг 3 из 4) выбрать вкладку Заголовки и задать названия диаграммы («Прогнозирование выпуска продукции на 7-ой год») и осей Х («Годы») и У («Выпуск продукции. млн. руб.»;;
Готово;
Выделить на полученной диаграмме ось Y (подвести курсор к требуемой оси и щелкнуть левой клавишей мыши);
Формат => Выделенная ось;
В появившемся диалоговом окне Формат оси выбрать вкладку Шкала;
В поле Минимальное значение – ввести минимальное (или несколько ниже) значение признака «Выпуск продукции»;
ОК.
Выделить диаграмму и с помощью приема "захват мышью" переместить ее в конец Рабочего файла.
Алгоритм 2.3. Нахождение тренда ряда динамики выпуска продукции методом аналитического выравнивания и прогнозирование его на год вперед с помощью инструмента Мастер диаграмм
Выделить мышью диаграмму «Прогнозирование выпуска продукции на 7-ой год», расположенную в конце Рабочего файла;
Диаграмма => Добавить линию тренда;
В появившемся диалоговом окне Линия тренда выбрать вкладку Тип и задать вид линии тренда – линейная;
Выбрать вкладку Параметры и выполнить действия:
Переключатель Название аппроксимирующей кривой: автоматическое/другое – установить в положение другое и ввести имя тренда– Прямая;
В поле Прогноз вперед на…едициц ввести значение «1»;
Поле Прогноз назад на…единиц – НЕ активизировать;
Флажок Пересечение кривой с осью Y в точке – НЕ активизировать;
Флажок Показывать уравнение на диаграмме – Активизировать;
Флажок Поместить на диаграмму величину достоверности аппроксимации R2 – Активизировать;
ОК;
Установить курсор на линию тренда, щелкнуть правой клавишей мыши и выбрать меню Формат линии тренда;
В появившемся диалоговом окне Формат линии тренда выбрать вкладку Вид и задать по своему усмотрению тип, цвет и толщину линии;
ОК;
Выделить уравнение линии тренда и индекс детерминации R2 и с помощью приема "захват мышью" вынести их за корреляционное поле. При необходимости уменьшить размер шрифта.
Действия 1 – 4 (в п.4 шаги 1–11) выполнить для линии тренда:
парабола;
полином 3-го порядка.
Результат работы алгоритмов 2.2 – 2.3 для демонстрационного примера представлен на рис.3.1.
EMBED Excel.Chart.8 \s Рис.3.1. График динамики выпуска продукции за 6 лет и прогноз выпуска на год вперед
Задание 3.
Выявление тенденции развития изучаемого явления (тренда) по данным о выпуске продукции по месяцам за 6-ой год методами скользящей средней и аналитического выравнивания.
Выполнение Задания 3 заключается в решении двух задач:
Задача 1. Расчет скользящей средней, полученной на основе трёхчленной скользящей суммы.
Задача 2. Аналитическое выравнивание по прямой и параболе.
Алгоритмы выполнения Задания 3
Задача 1. Расчет скользящей средней, полученной на основе трёхчленной скользящей суммы
Алгоритм 3.1. Нахождение значений скользящей средней с помощью инструмента СКОЛЬЗЯЩЕЕ СРЕДНЕЕ надстройки ПАКЕТ АНАЛИЗА
Сервис => Анализ данных => Скользящее среднее => ОК;
Входной интервал <= диапазон ячеек табл. 3.5 со значениями признака – Выпуск продукции (В47:В58);
Метки в первой строке– НЕ активизировать;
Интервал – НЕ активизировать;
Выходной интервал <= адрес первой ячейки третьего столбца выходной результативной таблицы (С47);
Новый рабочий лист и Новая рабочая книга – НЕ активизировать;
Вывод графика –Активизировать;
Стандартные погрешности – НЕ активизировать;
ОК.
Выделить диаграмму и с помощью приема "захват мышью" переместить ее в конец Рабочего файла.
В результате указанных действий осуществляется вывод значений скользящей средней, начиная с ячейки, указанной в поле Выходной интервал диалогового окна инструмента Скользящее среднее, и графика. Для демонстрационного примера они представлены в табл.3.5 и на рис.3.2.
EMBED Excel.Chart.8 \s
Рис.3.2. График сглаживания ряда динамики выпуска продукции за 6-ой год, сгенерированный в режиме «скользящее среднее» Пакета анализа
Алгоритм 3.2. Приведение выходной таблицы к виду, принятому в статистике
Ячейку С47, содержащую термин " #Н/Д", выделить мышью и очистить, нажав клавишу [Delete];
Ячейки результативной таблицы (С49:С58), содержащие значения «Скользящее среднее», вырезать с помощью инструмента ;
Вставить в табл. 3.5, начиная с ячейки С48, с помощью инструмента ;
Отформатировать таблицу по образцу с помощью инструмента .
Для демонстрационного примера полученная результативная таблица выглядит следующим образом.
График сглаживания ряда динамики выпуска продукции методом скользящей средней представлен на рис. 3.3.
EMBED Excel.Chart.8 \s
Рис.3.3. График сглаживания скользящей средней ряда динамики выпуска продукции за 6-ой год
Задача 2. Аналитическое выравнивание по прямой и параболе
Алгоритм 3.3. Построение графика динамики выпуска продукции по месяцам за 6-ой год с использованием средств инструмента МАСТЕР ДИАГРАММ
Выделить мышью столбец данных в диапазоне B47:В58 (табл. 3.5);
Вставка=>Диаграмма=>Точечная;
В появившемся диалоговом окне Мастер диаграмм (шаг 1 из 4) выбрать вид точечной диаграммы, на которой значения соединены отрезками;
Далее;
В появившемся диалоговом окне Мастер диаграмм (шаг 2 из 4) выбрать вкладку Ряд и ввести имя ряда «Исходные данные»;
Далее;
В появившемся диалоговом окне Мастер диаграмм (шаг 3 из 4) выбрать вкладку Заголовки и задать названия диаграммы («Выпуск продукции за 6-ой год по месяцам») и осей Х («Месяцы») и У («Выпуск продукции. млн. руб.»;
Готово.
Выделить диаграмму и с помощью приема "захват мышью" переместить ее в конец Рабочего файла.
Алгоритм 3.4. Сглаживание ряда динамики выпуска продукции методом аналитического выравнивания с помощью инструмента Мастер диаграмм
Выделить мышью диаграмму «Выпуск продукции за 6-ой год по месяцам», расположенную в конце Рабочего файла;
Диаграмма => Добавить линию тренда;
В появившемся диалоговом окне Линия тренда выбрать вкладку Тип и задать вид линии тренда – линейная;
Выбрать вкладку Параметры и выполнить действия:
Переключатель Название аппроксимирующей кривой: автоматическое/другое – установить в положение другое и ввести имя тренда - Прямая;
Поле Прогноз вперед на – НЕ активизировать;
Поле Прогноз назад на – НЕ активизировать;
Флажок Пересечение кривой с осью Y в точке – НЕ активизировать;
Флажок Показывать уравнение на диаграмме – Активизировать;
Флажок Поместить на диаграмму величину достоверности аппроксимации R2 – Активизировать;
ОК;
Установить курсор на линию тренда, щелкнуть правой клавишей мыши и выбрать меню Формат линии тренда;
В появившемся диалоговом окне Формат линии тренда выбрать вкладку Вид и задать по своему усмотрению тип, цвет и толщину линии;
ОК;
Выделить уравнение линии тренда и индекс детерминации R2 и с помощью приема "захват мышью" вынести их за корреляционное поле. При необходимости уменьшить размер шрифта.
Действия 1 – 4 (в п.4 шаги 1–11) выполнить для линии тренда парабола.
По окончании работы алгоритма 2.4 выполнить следующие действия:
Снять заливку области построения;
При необходимости изменить масштаб шкалы осей диаграммы.
Результат работы алгоритмов 3.3 – 3.4 для демонстрационного примера представлен на рис.3.4.
EMBED Excel.Chart.8 \s
Рис. 3.4. График сглаживания по прямой и параболе ряда динамики выпуска продукции за 6-ой год