EMBED MSPhotoEd.3 ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №2
Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel
Вариант №99
Выполнила:
ст. III курса гр.345
Акулова Е.Ю.
Ф.И.О.
Проверила:
к.э.н. Калиничева И.Д,
Ф.И.О.
Серпухов, 2007г.
Постановка задачи
Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.
В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.
Таблица исходных данных
В процессе статистического исследования необходимо решить ряд задач.
Установить наличие статистической связи между факторным признаком Х и результативным признаком Y:а) графическим методом;
б) методом сопоставления параллельных рядов.
Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
Оценить тесноту связи признаков Х и Y на основе:а) эмпирического корреляционного отношения ?;б) линейного коэффициента корреляции r.
Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа.
Оценить адекватность и практическую пригодность построенной линейной регрессионной модели, указав:
а) значимость и доверительные интервалы коэффициентов а0, а1;
б) индекс детерминации R2 и его значимость;
в) точность регрессионной модели.
Дать экономическую интерпретацию:
а) коэффициента регрессии а1;
б) коэффициента эластичности КЭ;
в) остаточных величин EMBED Equation.3 i.
Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.
II. Выводы по результатам выполнения лабораторной работы.
Задача 1. Установление наличия статистической связи между факторным признаком Х и результативным признаком Y графическим методом и методом сопоставления параллельных рядов.
Вывод:
Точечный график связи признаков (диаграмма рассеяния, полученная в Лабораторной работы №1 после удаления аномальных значений), а также табл.2.1, представляющая два параллельных ряда значений признаков X и Y с ранжированными значениями xi (В4:С33) показывают, что с увеличением значений факторного признака увеличиваются значения результативного признака. Это позволяет сделать вывод, что имеет место статистическая связь. Предположительный вид связи – линейная прямая.
Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.
Вывод:
Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что с увеличением факторного признака Х увеличиваются средние значения признака Y.
Задача 3.Оценка тесноты связи признаков Х и Y:
а) на основе эмпирического корреляционного отношения.
Для анализа тесноты связи между факторным и результативным признаками рассчитывается показатель ? - эмпирическое корреляционное отношение, задаваемое формулой
EMBED Equation.3 ,
где EMBED Equation.3 и EMBED Equation.3 - соответственно межгрупповая и общая дисперсии результативного признака Y - Выпуск продукции.
Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.
Вывод:
Значение коэффициента ?=0,8149858, что в соответствии с оценочной шкалой Чэддока говорит о высокой степени связи изучаемых признаков.
б) на основе линейного коэффициента корреляции признаков.
В предположении, что связь между факторным и результативным признаками прямолинейная, для оценки тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа, в результате применения которого построена табл.2.5 Рабочего файла.
Вывод:
Значение коэффициента корреляции r= 0,91318826 , что в соответствии со шкалой Чэддока говорит о высокой степени связи изучаемых признаков.
Так как значение коэффициента корреляции r положительное , то связь между признаками прямая. Посредством показателя ? измеряется теснота связи любой формы, а с помощью коэффициента корреляции r – только прямолинейная, следовательно, значения ? и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если EMBED Equation.3 , то гипотезу о прямолинейности связи можно считать подтвержденной.
Вывод:
При ?=0,8149858 и r= 0,91318826 величина EMBED Equation.3 = 0,0982024, следовательно, связь между признаками X и Y предположительно прямолинейная.
Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.
Вывод:
Рассчитанные в табл.4.8 (ячейки В91 и В92) коэффициенты а0 и а1 позволяют построить линейную регрессионную модель связи изучаемых признаков в виде уравнения EMBED Equation.3 1,089355181х-1103,964244.
Задача 5. Оценка адекватности и практической пригодности построенной линейной регрессионной модели.
1.1. Определение значимости коэффициентов уравнения.
Уровень значимости – это величина ?=1-Р, где Р заданный уровень надежности (доверительная вероятность).
Если Р-значение коэффициента в результативной таблице меньше заданного уровня значимости ?=1-0,95=0,05, то этот коэффициент признается неслучайным (типичным для генеральной совокупности).
Вывод:
Для свободного члена уравнения а0 уровень значимости есть 0,1045022. Так как этот уровень больше заданного уровня значимости ?=0,05, то коэффициент а0= -1103,964244 признается случайным.
Для коэффициента регрессии а1 уровень значимости есть 1,976Е-12 Так как этот уровень меньше заданного уровня значимости ?=0,05, то коэффициент а1=1,089355181 признается типичным.
1.2. Оценка доверительных интервалов коэффициентов уравнения регрессии.
Доверительные интервалы коэффициентов уравнения регрессии а0, а1 при уровнях надежности Р=0,95 и Р=0,683 приведены в следующей таблице:
Вывод:
Увеличение уровня надежности ведет к расширению доверительных интервалов коэффициентов уравнения, в которых могут находиться коэффициенты а0, а1 уравнения связи признаков для генеральной совокупности предприятий.
Определение практической пригодности построенной регрессионной модели.
Вывод:
Согласно таблице "Регрессионная статистика" r=0,91318826, R2=0,833912798. Поскольку EMBED Equation.3 >0,7 и R2>0,5 , то построенная линейная регрессионная модель связи пригодна для практического использования.
Общая оценка адекватности регрессионной модели по F-критерию Фишера.
Вывод:
Уровень значимости индекса детерминации R2 равен 1,98Е-12. Так как этот уровень меньше заданного уровня значимости ?=0,05, то значение R2 признается типичным и построенная модель связи между признаками Х и Y применима для генеральной совокупности предприятий отрасли в целом.
Оценка погрешности регрессионной модели.
Погрешность регрессионной модели можно оценить по средней квадратической ошибке EMBED Equation.3 построенного уравнения регрессии, представляющей собой среднее квадратическое отклонение эмпирических значений yi признака Y от его теоретических значений EMBED Equation.3 .
В адекватных моделях ошибка EMBED Equation.3 не должна превышать 12%-15%.
Вывод:
Погрешность линейной регрессионной модели составляет 9,17%, что подтверждает адекватность модели.
Задача 6. Дать экономическую интерпретацию:
1) коэффициента регрессии а1;
2) коэффициента эластичности КЭ;
3) остаточных величин EMBED Equation.3 i.
1. Экономическая интерпретация коэффициента регрессии а1.
Вывод:
Коэффициент регрессии а1=1,089355181 показывает, что в среднем (в абсолютном выражении) значения признака Y при изменении признака Х увеличиваются на 1.089355181.
2. Экономическая интерпретация коэффициента эластичности.
Вывод:
Коэффициент эластичности КЭ =16,7 показывает, что на 16,7% изменяется в среднем результативный признак при изменении факторного признака на 1%.
3. Экономическая интерпретация остаточных величин EMBED Equation.3 i.
Вывод:
Согласно таблице остатков, в построенной линейной регрессионной модели наибольшее превышение среднего объема выпускаемой продукции EMBED Equation.3 имеют три предприятия - с номерами 6, 20, 27, а наибольшие отрицательные отклонения от среднего объема выпуска - три предприятия с номерами 8, 24, 26. Именно эти шесть предприятий подлежат дальнейшему экономическому анализу для выяснения причин наибольших отклонений объема выпускаемого продукта от ожидаемого среднего объема и выявления резервов роста производства.
Задача 7. Нахождение наиболее адекватного нелинейного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической кривой регрессии.
Уравнения регрессии и их графики построены для 4-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.
Уравнения регрессии и соответствующие им индексы детерминации R2 приведены в следующей таблице:
Регрессионные модели связи
Выбор наиболее адекватного уравнения регрессии определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.
Вывод:
Максимальное значение индекса детерминации R2 = 0,8381, следовательно, наиболее адекватное нелинейное уравнения регрессии – EMBED Equation.3 3Е – 0,8 EMBED Equation.3 -0,0006 EMBED Equation.3 + 5,0568х - 9470
Это уравнение регрессии и его график приведены на рис.2.2 Рабочего файла.