Постановка задачи
Корреляционно-регрессионный анализ (КР-анализ) взаимосвязи признаков является составной частью проводимого статистического исследования двух экономических показателей статистической совокупности 32 предприятий и частично использует результаты Лабораторной работы №1.
В лабораторной работе №2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы №1 после исключения из них аномальных значений.










Таблица 1
Исходные данные
В процессе статистического исследования необходимо решить ряд задач.
1.Установить наличие статистической связи между факторным признаком Х и результативным Y:
Графическим методом;
Методом сопоставления параллельных рядов.
2.Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
3.Оценить тесноту связи признаков Х и Y на основе:
Эмпирического корреляционного отношения ?;
Линейного коэффициента корреляции r.
4.Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент регрессия надстройки Пакет анализа.
5. Оценить адекватность и практическую пригодность построенной линейной регрессионной модели, указав:
Доверительные интервалы коэффициентов EMBED Equation.3 ;
Степень тесноты связи признаков Х и Y;
Погрешность регрессионной модели.
6) Дать экономическую интерпретацию:
Коэффициента регрессии EMBED Equation.3 ;
Коэффициента эластичности EMBED Equation.3 ;
Остаточных величин EMBED Equation.3 .
7. Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.
Отчётность по работе:
Результативные таблицы и графики:


Таблица 2
Зависимость выпуска продукции от среднегодовой стоимости
основных фондов
Таблица 3
Показатели внутригрупповой вариации
Таблица 4
Показатели дисперсии и эмпирического
корреляционного отношения

Таблица.5
Линейный коэффициент корреляции признаков
Выходные таблицы
Таблица 6
ВЫВОД ИТОГОВ
Таблица 7
Дисперсионный анализ
Таблица 8
Таблица 9
ВЫВОД ОСТАТКА

EMBED Excel.Chart.8 \s
рисунок 1.

EMBED Excel.Chart.8 \s
рисунок 2.


EMBED Excel.Chart.8 \s
рисунок 3.
Выводы по результатам лабораторной работы
Задание 1. Наличие статистических взаимосвязей признаков устанавливается на основе теоретического анализа. Для выявления наличия статистических связей между факторным признаком Х (Среднегодовая стоимость основных производственных фондов) и результативным признаком Y (выпуск продукции) применяются разнообразные статистические методы:
а) Графический метод состоит в построении корреляционного поля – множества точек ( EMBED Equation.3 ). По характеру расположения точек корреляционного поля можно сделать вывод о наличии или отсутствии связи. В нашем случае точки группируются вокруг некоторой определённой линии, то есть возле линии регрессии (рисунок 3). Анализируя данные рисунка 3. видно, что точки ( EMBED Equation.3 ) не лежат на одной линии, но всё же их расположение обнаруживает определённую тенденцию, которая выражается видом эмпирической линии связи. Эта линия связи (рисунок 3) по своему виду приближается к прямой линии, то есть связи между факторным признаком Х (Среднегодовая стоимость основных производственных фондов) и результативным признаком Y (выпуск продукции) линейная прямая.
б) Метод сопоставления параллельных рядов заключается в выявлении статистической связи путём простого параллельного сравнения факторных и результативных значений. Для этого, значения фактора Х ранжируется (таблица 10). Таблица 10
Ранжирование по возрастанию признака
«Среднегодовая стоимость производственных фондов»
Из таблицы видно, что с возрастанием значений признака «Среднегодовая стоимость основных производственных фондов» значения признака «Выпуск продукции» также в целом возрастают при наличии некоторых отклонений от этой общей тенденции, то можно сделать вывод о том, что между признаками Х и Y возможно наличие прямой корреляционной связи.
Задание 2. При выявлении наличия связи методом аналитической группировки строится аналитическая таблица (таблица 2), отражающая результаты аналитической группировки единиц совокупности по факторному признаку Х (Среднегодовая стоимость основных производственных фондов). Анализируя данные таблицы 2, можно заметить, что при переходе от одной группы к другой средние значения признака «Выпуск продукции» изменяются с определённой закономерностью, то есть возрастают. Это говорит о том, что между признаком Х (Среднегодовая стоимость основных производственных фондов) и результативным признаком Y (выпуск продукции) существует корреляционная связь.
Задание 3. а) Для анализа тесноты связи признаков Х и Y рассчитан показатель эмпирического корреляционного отношения ? (таблица 4). Для показателей силы и тесноты корреляционной связи характерно следующее свойство:
EMBED Equation.3
Чем ближе значение показателя к единице, тем теснее связь и больше сила связи. В нашем случае ? = 0,902, то есть значение показателя ближе к единице, то это говорит о тесной и сильной связи между признаками.
б) Оценить тесноту связи можно и с помощью линейного коэффициента корреляции r. Для качественной оценки тесноты связи используется Шкала Чэддока:
Значения показателей тесноты связи r: Характеристика связи:
0.1 – 0.3 слабая
0,3 – 0,5 умеренная
0.5 – 0,7 заметная
0,7 – 0,9 высокая
0,9 – 0,99 весьма высокая
Исходя из данных таблицы 5, линейный коэффициент корреляции
r = 0, 91318826. то есть связь между признаками весьма высокая.
Задание 4. Регрессионный анализ заключается в определении аналитического выражения связи между факторным признаком Х и результативным признаком Y.
В случае линейной формы связи построение модели средствами Excel осуществляется с помощью инструмента Регрессия надстройки Пакет анализа.
В результате работы инструмента Регрессия Excel формирует следующий набор таблиц.
1. Таблица Регрессионная статистика (таблица 6).
2. Таблица Дисперсионный анализ (таблица 7).
3. Результативная таблица (таблица 8).
4. Таблица Вывод остатка (таблица 9).
Задание 5. Проверка адекватности регрессионной модели фактическим данным наблюдения осуществляется путем оценки тесноты связи между факторными значениями Х и выровненными результативными значениями Y.
а) Доверительные интервалы построенной регрессионной модели для коэффициента EMBED Equation.3 , рассчитанные для уровня надежности Р=0,95 от 0,901157173 до 1,277553, рассчитанные для уровня надежности Р=0,683 от 0,995749 до 1,182962. Доверительные интервалы коэффициента EMBED Equation.3 при Р=0,95 от -36,05456748 до 13,68889, при Р=0,683 от -23,5536 до 1,187938.
б) Для построенной регрессионной модели измерение тесноты связи признаков Х и Y осуществляется на основе R – индекса корреляции. Индекс корреляции R принимает значения в пределах 0?R?1. Близость индекса корреляции к единице означает, что связь между признаками достаточно хорошо описывается избранным уравнением корреляционной зависимости.
в) В качестве критерия адекватности регрессионной модели используются показатели:
- средняя квадратическая ошибка уравнения регрессии EMBED Equation.3 ,представляющая собой среднее квадратическое отклонение эмпирических значений признака Y от теоретических;
- средняя ошибка аппроксимации EMBED Equation.3 , выражающая в процентах меру отклонения расчетных значений Y от фактических.
В адекватных моделях ошибки не должны превышать 12-15%, в нашем случае стандартная ошибка равна 11,96707419, то есть модель наиболее адекватная.
Задание 6. Экономическая интерпретация построенной регрессионной модели взаимосвязи признаков используется для целей анализа и прогноза взаимосвязей признаков.
а) Величина коэффициента регрессии EMBED Equation.3 показывает, насколько в среднем (в абсолютном выражении) изменяется значение результативного признака Y при изменении фактора Х на единицу его измерения. В моем случае коэффициент регрессии EMBED Equation.3 =1,089355181, то есть на 1,089355181 в среднем изменяется значение результативного признака Y при изменении фактора Х на единицу его измерения.
б) с целью расширения возможностей экономического анализа используется коэффициент эластичности EMBED Equation.3 , который показывает, на сколько процентов изменяется в среднем результативный признак при изменении факторного признака на 1%. Э = 1,167%, то есть на 1,67% изменяется в среднем результативный признак при изменении факторного признака на 1%.
в) анализируя остатки EMBED Equation.3 , характеризующие отклонения i-х наблюдений от значений EMBED Equation.3 , которые следует ожидать в среднем, можно сделать ряд практических выводов об эффективности экономической деятельности рассматриваемых хозяйствующих субъектов и выявить скрытые резервы их развития и повышения деловой активности. При этом наиболее значительный экономический интерес представляют собой наибольшие и наименьше положительные и отрицательные отклонения EMBED Equation.3 .
Задание 7.
С помощью средств инструмента Мастер диаграмм была построена однофакторная нелинейная регрессионная модель. В результате на диаграмме рассеяния отображается линия и уравнение регрессии, а также коэффициент детерминации EMBED Equation.3 (рис. 2). Выбор наиболее адекватного уравнения нелинейной регрессии определяется максимальным значением коэффициента EMBED Equation.3 (рис. 3).



















































































Таблица 2.1
Исходные данные