EMBED MSPhotoEd.3
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ
ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №2
«Автоматизированный корреляционно-регрессионный
анализ взаимосвязи статистических данных в среде MS Excel»
Вариант №_10_


Выполнил: ст. III курса

Проверил: Резяпова А.А.


Уфа, 2006г.

Постановка задачи
Корреляционно-регрессионный анализ взаимосвязи признаков является составной часть проводимого статистического исследования двух экономических показателей статистической совокупности 32 предприятий и частично использует результаты Лабораторной работы №1.
В Лабораторной работе №2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений (Таблица 1а).
Таблица 1а
Исходные данные



В процессе статистического исследования необходимо решить ряд задач.
Установить наличие статистической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом;
б) методом сопоставления параллельных рядов.
Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
Оценить тесноту связи признаков Х и Y на основе:
а) эмпирического корреляционного отношения ?;
б) линейного коэффициента корреляции r.
Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа.
Оценить адекватность и практическую пригодность построенной линейной регрессионной модели, указав:
а) доверительные интервалы коэффициентов а EMBED Equation.3 , а EMBED Equation.3 ;
б) степень тесноты связи признаков Х и Y;
в) погрешность регрессионной модели.
Дать экономическую интерпретацию:
а) коэффициент регрессии а EMBED Equation.3 ;
б) коэффициента эластичности К EMBED Equation.3 ;
в) остаточных величин ? EMBED Equation.3 .
Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.



Алгоритмы выполнения всех заданий.
Распечатка рабочего файла с результативными таблицами
и графиками
Выполняются три задания:
Задание 1. Построение аналитической группировки для выявления корреляционной зависимости результативного признака от факторного и оценка тесноты взаимосвязи этих признаков.
Задание 2. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессии надстройки Пакет анализа.
Задание 3. Построение однофакторных нелинейных регрессионных моделей связи признаков с помощью инструмента Мастер диаграмм и выбор наиболее адекватного уравнения регрессии.
Алгоритмы выполнения Задания 1
Задача 1. Построение аналитической группировки предприятий
по признаку Среднегодовая стоимость основных
производственных фондов
Этап 1. Ранжирование единиц совокупности по возрастанию
факторного признака Среднегодовая стоимость основных
производственных фондов
Алгоритм 1.1. Ранжирование исходных данных.
1. Выделить исходные данные таблицы 1 (А4:С33);
2. Данные?Сортировка;
3. Сортировать по? заголовок столбца, по которому выполняется сортировка, т.е. Среднегодовая стоимость основных производственных фондов;
4. по возрастанию / по убыванию – устанавливается в положение по возрастанию;
5. Затем и В последнюю очередь по – не активизируются;
6. Идентифицировать поля по подписям / обозначениям столбцов листа – устанавливается в положение подписями;
ОК
В результате указанных действий в таблице 1б размещаются данные, ранжированные по возрастанию признака Среднегодовая стоимость основных производственных фондов.

Таблица1б
Исходные данные

Этап 2. Распределение предприятий по группам
Алгоритм 1.2. Выделение групп предприятий с помощью заливки контрастным
цветом
Из всего диапазона отсортированных данных А4:С33 выделить мышью диапазон ячеек первой группы, для чего необходимо отсчитать в ранжированном ряду количество строк, соответствующее числу предприятий первой группы ;
Нажать на панели инструментов кнопку заливки;
Выбрать цвет по собственному усмотрению;
Выполнить действия 1-3 для всех групп, выбирая контрастные цвета для цветовой заливки очередной группы.
Результат работы алгоритмов 1.1 и 1.2 в таблице 1в.

Таблица1в
Исходные данные

Этап 3. Расчет суммарных и средних групповых значений
результативного признака Y – Выпуск продукции
Алгоритм 1.3. Расчет суммарных групповых значений результативного признака
В ячейке (D41), для суммарного значения результативного признака Выпуск продукции первой группы, перед формулой поставить знак равенства «=»;
В качестве аргумента функции указать диапазон ячеек из таблицы 1в с результативными значениями у EMBED Equation.3 первой группы (визуально легко определяется по цвету заливки диапазона);
Enter;
Выполнить действия 1-3 поочередно для всех групп, используя цветовые заливки диапазонов.
Алгоритм 1.4. Расчет средних групповых значений результативного признака
В ячейке (Е41), для среднего значения признака Выпуск продукции, относящихся к первой группе, перед формулой поставит знак равенства «=»;
2. Enter;
3. Выполнить действия 1-2 поочередно для всех групп.
Для расчета итоговых сумм в табл. (в ячейках C46, D46, E46) перед формулами необходимо поставить знак равенства «=».
Результат работы алгоритмов 1.3 и 1.4 в таблице 2.
Таблица 2
Зависимость выпуска продукции от среднегодовой
стоимости основных фондов

Задача 2. Оценка тесноты связи изучаемых признаков
на основе эмпирического корреляционного отношения
Алгоритм 2.1. Расчет внутригрупповых дисперсий результативного признака
В ячейке D52:D56, для внутригрупповых дисперсий первой группы (D52), перед формулой поставить знак равенства «=»;
В качестве аргумента функции указать диапазон ячеек из таблицы 2в с ранжированными значениями у EMBED Equation.3 первой группы – визуально легко определяется по цвету заливки диапазона;
Enter;
Выполнить действия 1-3 поочередно для всех групп, используя цветовые заливки диапазонов.
Для расчета итоговых сумм в таблице 3 (в ячейках C57, D57) перед формулами необходимо поставить знак равенства «=».
Результат работы алгоритма 2.1 в таблице 3

Таблица 3
Показатели внутригрупповой вариации

Алгоритм 2.2. Расчет общей, средней из внутригрупповых и факторной
дисперсий

В ячейках В63, для общей дисперсии (А63), для средней из внутригрупповых дисперсий (В63) и для значения факторной дисперсии (С63) перед формулами необходимо поставить знак равенства «=».
Алгоритм 2.3. Расчет эмпирического корреляционного отношения
В ячейке, для эмпирического корреляционного отношения (D63) перед формулой поставить знак равенства «=»;
Enter;
В результате работы алгоритмов 2.2 – 2.3 Excel осуществляет вывод результатов расчета показателей (Таблица 4).
Таблица 4
Показатели дисперсии и эмпирического
корреляционного отношения

Задача 3. Оценка тесноты связи изучаемых признаков
на основе линейного коэффициента корреляции
Алгоритм 3.1. Расчет линейного коэффициента корреляции
Сервис ? Анализ данных ? Корреляция ? ОК.
Входной интервал ? диапазон ячеек таблицы 1в со значениями факторного и результативного признаков (В4:С33);
Группирование – по столбцам;
Метки в первой строке – не активизировать;
Выходной интервал – адрес ячейки заголовка первого столбца выходной таблицы 5 (А68);
Новый рабочий лист и Новая рабочая книга – не активизировать;
ОК.
В результате работы алгоритма 3.1 Excel выдает оценку тесноты связи факторного и результативного признаков (Таблица 5).
Таблица 5
Линейный коэффициент корреляции признаков

Алгоритм выполнения Задания 2
Алгоритм 1. Расчет параметров уравнения линейной регрессии и проверка его
адекватности фактическими данными
Сервис ? Анализ данных ? Регрессия ? ОК;
Входной интервал Y ? диапазон ячеек таблицы со значениями признака Y – Выпуск продукции (С4:С33);
Входной интервал Х ? диапазон ячеек таблицы со значениями признака Х – Стоимость основных фондов (В4:В33);
Метки в первой строке / Метки в первом столбце – не активизировать;
Уровень надежности ? 68,3;
Константа – ноль – не активизировать;
Выходной интервал ? адрес ячейки заголовка первого столбца первой выходной результативной таблицы (А75);
Новый рабочий лист и Новая рабочая книга – не активизировать;
Остатки – активизировать;
Стандартизованные остатки – не активизировать;
График остатков – не активизировать;
График подбора – не активизировать;
График нормальной вероятности – не активизировать;
ОК;
Полученный график необходимо расположить после выходных таблиц, начиная с ячейки А135.
В результате указанных действий осуществляется вывод в заданный диапазон рабочего файла четырех выходных таблиц и одного графика, начиная с ячейки, указанной в поле Выходной интервал.



EMBED Excel.Chart.8 \s
Алгоритм выполнения Задания 3
Алгоритм 1. Построение уравнений регрессионных моделей для различных видов
зависимости признаков с использованием средств инструмента
Мастер диаграмм
Выделить мышью диаграмму рассеяния, расположенную начиная с ячейки Е4, и увеличить масштаб диаграммы на весь экран;
Диаграмма ? Добавить линию тренда;
Выбрать вкладку Тип, задать вид регрессионной модели – полином 2-го порядка;
Выбрать вкладку Параметры и выполнить действия:
Переключатель Название аппроксимирующей кривой: автоматическое / другое – установить в положение автоматическое;
Поле Прогноз вперед на – не активизировать;
Поле Прогноз назад на – не активизировать;
Флажок Пересечение кривой с осью Y в точке – не активизировать;
Флажок Показывать уравнение на диаграмме – активизировать;
Флажок Поместить на диаграмму величину достоверности аппроксимации R EMBED Equation.3 - активизировать;
ОК;
Установить курсор на линию регрессии и щелкнуть правой клавишей мыши;
В появившемся диалоговом окне Формат линии тренда выбрать тип, цвет и толщину линии;
ОК;
Вынести уравнение и коэффициент R EMBED Equation.3 за корреляционное поле. При необходимости уменьшить размер шрифта.
Действия 3-4 (в п.4 – шаги 1-11) выполнить поочередно для следующих видов регрессионных моделей:
полином 3-го порядка;
степенная;
экспоненциальная.
Переместить Диаграмму 1 в конец рабочего файла, начиная с ячейки А155.
В результате указанных действий для выбранных видов моделей регрессии осуществляется вывод на диаграмму рассеяния четырех уравнений регрессии, их графиков и значений соответствующих коэффициентов детерминации R EMBED Equation.3 (Диаграмма 1).
Диаграмма 1
Уравнения регрессии и их графики
EMBED Excel.Chart.8 \s
Алгоритм 2. Построение наиболее адекватного уравнения регрессии
Путем визуального анализа значений R EMBED Equation.3 выбрать по максимальной величине R EMBED Equation.3 наиболее адекватное уравнение регрессии;
Выделить диаграмму рассеяния, расположенную начиная с ячейки Е20;
Диаграмма ? Добавить линию тренда;
Выбрать вкладку Тип и задать вид наиболее адекватной нелинейной регрессионной модели;
Выбрать вкладку Параметры:
Переключатель Название аппроксимирующей кривой: автоматическое / другое – установить в положение автоматическое;
Поле Прогноз вперед на – не активизировать;
Поле Прогноз назад на – не активизировать;
Флажок Пересечение кривой с осью Y в точке – не активизировать;
Флажок Показывать уравнение на диаграмме – активизировать;
Флажок Поместить на диаграмму величину достоверности аппроксимации R EMBED Equation.3 - активизировать;
ОК.
Переместить Диаграмму 2 в конец рабочего файла, начиная с ячейки А190.
В результате указанных действий осуществляется вывод на диаграмму рассеяния уравнения регрессии для выбранной наиболее адекватной модели регрессии, ее графика и значения коэффициента детерминации R EMBED Equation.3 (Диаграмма 2).
Диаграмма 2
Наиболее адекватное уравнение регрессии и его график
EMBED Excel.Chart.8 \s



Выводы по результатам выполнения лабораторной работы
1. Установить наличие статистической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом:
Графический метод состоит в построении корреляционного поля – множества точек (x EMBED Equation.3 ,y EMBED Equation.3 ) в декартовой системе координат (Х,Y).
По характеру расположения точек корреляционного поля можно сделать вывод:
связь между признаками сильная, точки группируются тесно;
равномерное изменение значения результативного признакаY, говорит о наличии прямолинейной корреляционной связи.
EMBED Excel.Chart.8 \s
б) методом сопоставления параллельных рядов:
Метод сопоставления взаимосвязанных параллельных рядов является простейшим приемом обнаружения связи между признаками.
С возрастанием значений признака Х значения признака Y также в целом возрастают при наличии некоторых отклонений от этой общей тенденции (Таблица 1в), то между признаками Х и Y возможно наличие прямой корреляционной связи.
2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки:
При переходе от одной группы к другой средние значения ? EMBED Equation.3 изменяются с определенной закономерностью – возрастают (Таблица 2), то между признаками Х и Y существует корреляционная связь.
Оценить тесноту связи признаков Х и Y на основе:
а) эмпирического корреляционного отношения ?:
Эмпирическое корреляционное отношение ? = 0,903 (Таблица 4).
б) линейного коэффициента корреляции r.
Линейный коэффициент корреляции r = 0,913 ( Таблица 5).
Значения показателей изменяются в пределах:
-1? r ? 1, 0 ? ? ? 1.
Т.к. чем ближе значения показателей к единице, тем теснее связь и больше сила связи.
Знак при r указывает на направление связи – знак «+» соответствует прямой линейной зависимости.
По шкале Чэддока значения показателей тесноты связи r, ? лежат в промежутке от 0,9 -0,99, а это значит весьма высокая связь.
Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа.
Смотреть Задание 2.
Оценить адекватность и практическую пригодность построенной линейной регрессионной модели, указав:
а) доверительные интервалы коэффициентов а EMBED Equation.3 , а EMBED Equation.3 :
а EMBED Equation.3 = -121,565, а EMBED Equation.3 = 1,089
Доверительные интервалы коэффициентов а EMBED Equation.3 , а EMBED Equation.3 даны в Задание 2.
б) степень тесноты связи признаков Х и Y:
Для построенной регрессионной модели измерение тесноты связи признаков X и Y осуществляется на основе следующих показателей:
R EMBED Equation.3 - индекс детерминации равный 0,83;
R – индекс корреляции равный 0,91;
r - линейный коэффициент корреляции равный 0,91.
Индекс корреляции R принимает значение в пределах 0? R ?1, и близость R к единице означает, что связь между признаками достаточно хорошо описывается избранным уравнением корреляционной зависимости.
Аналогичные утверждения имеют место и для линейного коэффициента корреляции r, принимающего значение в пределах -1? r ? 1.
Пригодность построенной регрессионной модели для практического использования можно оценить и по величине индекса детерминации R EMBED Equation.3 : неравенству R EMBED Equation.3 > 0.5 отвечают значения R> 0.7 (или г > 0,7), что означает высокую степень тесноты связи признаков в уравнении регрессии. При этом более 50% вариации расчетных значений признака Y объясняется влиянием фактора Х, что позволяет считать применение синтезированного уравнения регрессии правомерным.

Дать экономическую интерпретацию:
а) коэффициент регрессии а EMBED Equation.3 :
Коэффициент регрессии, а EMBED Equation.3 равен 1,089. Величина коэффициента регрессии, а EMBED Equation.3 показывает, насколько в среднем изменяется значение результативного признака Y при изменении фактора Х на единицу его измерения.
б) коэффициента эластичности К EMBED Equation.3 :
Коэффициент эластичности К EMBED Equation.3 показывает, на сколько процентов изменяется в среднем результативный признак при изменении факторного признака на 1%.
в) остаточных величин ? EMBED Equation.3 .
Анализируя остатки ? EMBED Equation.3 , характеризующие отклонения i-х наблюдений от значений y EMBED Equation.3 , которые следует ожидать в среднем, можно сделать ряд практических выводов об эффективности экономической деятельности рассматриваемых хозяйствующих субъектов и выявить скрытые резервы их развития и повышения деловой активности. При этом наиболее значительный экономический интерес представляют наибольшие и наименьшие положительные и отрицательные отклонения ? EMBED Equation.3 .
Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.
Построение наиболее адекватного уравнения регрессии представлено на Диаграмме 2.