ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА МАТЕМАТИКИ И ИНФОРМАТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы № 2
по теме:
Множественный корреляционный анализ (используя ППП СтатЭксперт, Microsoft Excel, SPSS)
Вариант № 8
Уфа, 2007 г.
Задача 1
По данным, представленным в табл. 1, исследуется зависимость между величиной накладных расходов 40 строительных организаций Y (млн. руб.) и следующими тремя основными факторами:
Х1 – объемом выполненных работ, млн. руб.
Х2 – численность рабочих, чел.
Х3 – фонд заработной платы, млн. руб.
Таблица 7
№ п/п
Накладные расходы, млн. руб.
Объем работ, млн. руб.
Численность рабочих, чел.
Фонд заработной платы рабочих, млн. руб.

1
3,5
11,9
980
5,754

2
4,0
12,1
675
5,820

3
3,1
11,2
1020
4,267







38
1,6
7,4
159
1,570

39
1,2
2,2
162
1,142

40
1,5
2,6
101
0,429


Задание:
Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель для зависимой переменной «Накладные расходы» за счет значимых факторов. Рассчитать индекс корреляции R и оценить качество полученного уравнения регрессии с помощью коэффициента детерминации R2.
Оценить статистическую значимость уравнения регрессии, используя критерий Фишера F (? = 0,05).
Дать сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, ?- и ?-коэффициентов.
Ранжировать предприятия по степени их эффективности.
МНОЖЕСТВЕННЫЙ КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
Решение задачи с помощью ППП СтатЭксперт
Корреляционный анализ
Создать файл исходных данных в среде Excel.
Пуск > Программы > Microsoft Excel.
В появившейся книге внести данные. Для этого в ячейке А1 записать «X», в ячейке А2 «Y» и далее числовые данные (рис. 27).

Рис. 27
Сохранить таблицу данных в формате Excel (Файл > Сохранить).
Свернуть окно Excel и перенести файл исходных данных в среду Word и сохранить в Word.
Запуск программы «СтатЭксперт».
Пуск > Программы > Olymp > СтатЭксперт > Включить макросы.
На экране появится картинка «СтатЭксперт». Дать команду «Начало работы». Появится таблица программы «СтатЭксперт».
Включить режим работы программы.
Активизировать файл исходных данных и отметить в нем цифровые данные таблицы.
Вызвать меню «СтатЭкс», затем – «Корреляция».
Предварительная обработка данных.
В окне «Установка блока данных» установить следующие параметры: ориентация таблицы «по строкам», наличие наименований снять все флажки (рис. 2). Нажать кнопку «Установить».
В окне «Корреляционный анализ» перенести все показатели в правую часть окна с помощью кнопки «Добавить все». Убрать галочку «Построение графиков» (рис. 28). Нажать кнопку «Вычислить».

Рис. 28
В результате получили следующий протокол отчета в таб. 7.1.
Таблица 7.1
Протокол корреляционного анализа
 
 
 
 

 
 
 
 
 

Матрица парных корреляций
 
 
 
 

Переменная
Показатель-A
Показатель-B
Показатель-C
Показатель-D

Показатель-A
1.000
0.869
0.682
0.780

Показатель-B
0.869
1.000
0.735
0.871

Показатель-C
0.682
0.735
1.000
0.611

Показатель-D
0.780
0.871
0.611
1.000

Критическое значение на уровне 90% при 2 степенях свободы = +0.2658
 
 
 
 

 
 
 
 
 

Матрица максимальных корреляций
 
 
 
 

Переменная
Показатель-A
Показатель-B
Показатель-C
Показатель-D

Показатель-A
1.000
0.869
0.792
0.780

Показатель-B
0.869
1.000
0.755
0.871

Показатель-C
0.792
0.755
1.000
0.611

Показатель-D
0.780
0.871
0.611
1.000


 
 
 
 

 
 
 
 
 

Матрица оптимальных лагов
 
 
 
 

Переменная
Показатель-A
Показатель-B
Показатель-C
Показатель-D

Показатель-A
0
0
1
0

Показатель-B
0
0
1
0

Показатель-C
1
1
0
0

Показатель-D
0
0
0
0


 
 
 
 

 
 
 
 
 

Матрица частных корреляций
 
 
 
 

Переменная
Показатель-A
Показатель-B
Показатель-C
Показатель-D

Показатель-A
1.000
0.519
0.137
0.103

Показатель-B
0.519
1.000
0.370
0.615

Показатель-C
0.137
0.370
1.000
-0.100

Показатель-D
0.103
0.615
-0.100
1.000

Критическое значение на уровне 90% при 4 степенях свободы = +0.2665
 
 
 
 

 
 
 
 
 

Множественные корреляции
 
 
 
 

Переменная
Коэффициент
F-значение
%точкаF-распред.
 

Показатель-A
0.873
16.054
100.000
 

Показатель-B
0.934
33.992
100.000
 

Показатель-C
0.743
6.155
99.787
 

Показатель-D
0.874
16.160
100.000
 

Число степеней свободы = 4 и 19
 
 
 
 


Проведем корреляционный анализ на основе полученной в программе «СтатЭксперт» матрицы парных коэффициентов (выделена в таблице 7.2 серым цветом):
Таблица 7.2
 
Y
X1
X2
X3

Y
1.000
0.869
0.682
0.780

X1
0.869
1.000
0.735
0.871

X2
0.682
0.735
1.000
0.611

X3
0.780
0.871
0.611
1.000


Установим значимость парного коэффициента корреляции между Y и каждым фактическим признаком Х. Для этого проверим значимость парных коэффициентов корреляции, используя t-критерий Стьюдента.
Найдем tрасч, используя формулу:
n = 28 – 4 = 25
Значения r берем из матрицы парных корреляций на рис. 35
Сравним tрасч с tтабл:
Табличное значение критерия Стьюдента равно: tтабл = (? = 0,05, k = n – 2 = 23) = 2,0687. сравнивая числовые значения критериев, видно, что tрасч > tтабл, т.е. все полученные значения коэффициентов корреляции значимы.
Установим наличие мультиколлинеарности между факторными признаками.
rx2x2 = 0,735 < 0,8
rx3x2 = 0,871 > 0,8 => признак Х2 можно исключить
rx3x3 = 0,611 < 0,8
Ослабим эффект мультиколлинеарности путем исключения одного из признаков в рассматриваемых парных коэффициентах корреляции. В результате данной операции остаются признаки Х1 (объем работ) и Х3 (фонд заработной платы), которые наиболее тесно связаны с Y (накладные расходы).
Решение задачи с помощью ППП Microsoft Excel
Выбрать команду Сервис > Анализ данных.
В диалоговом окне «Анализ данных» выбрать инструмент «Корреляция», а затем щелкнуть на кнопку ОК (рис. 29).

Рис. 29
В диалоговом окне «Корреляция» в поле «Входной интервал» необходимо ввести диапазон ячеек $B$6:$E$30.
Выбрать параметры вывода. В данном примере Новый рабочий лист. Нажать ОК (рис. 30).

Рис. 30
Получили следующую матрицу парных коэффициентов (таб. 7.3):
Таблица 7.3
 
Y
X1
X2
X3

Y
1
 
 
 

X1
0,86946995
1
 
 

X2
0,68158354
0,73467836
1
 

X3
0,77965993
0,87140867
0,6113
1


Регрессионный анализ
Задание 1
Создать файл исходных данных в среде Excel.
Пуск > Программы > Microsoft Excel.
В появившейся книге внести данные. Для этого в ячейке А1 записать «X», в ячейке А2 «Y» и далее числовые данные (рис. 27).
Сохранить таблицу данных в формате Excel (Файл > Сохранить).
Свернуть окно Excel и перенести файл исходных данных в среду Word и сохранить в Word.
Запуск программы «СтатЭксперт».
Пуск > Программы > Olymp > СтатЭксперт > Включить макросы.
На экране появится картинка «СтатЭксперт». Дать команду «Начало работы». Появится таблица программы «СтатЭксперт».
Включить режим работы программы.
Активизировать файл исходных данных и отметить в нем цифровые данные таблицы.
Вызвать меню «СтатЭкс», затем – «Регрессия».
Предварительная обработка данных.
В окне «Установка блока данных» установить следующие параметры: ориентация таблицы «по строкам», наличие наименований снять все флажки (рис. 2). Нажать кнопку «Установить».
В окне «Регрессионный анализ» перенести показатели А, В, С, D в правую часть окна, нажав на кнопку «Добавить все». Установить зависимую переменную с помощью кнопки «Выбор» (рис. 31). Выделив в появившемся окне нужную переменную, нажать кнопку «Установить».

Рис. 31
Установить вид регрессии – линейная. Нажать «Вычислить».
На запрос программы «Включить фактор времени» нажать Нет (рис. 32).

Рис. 32
Протокол отчета представлен в таб. 7.4:
Таблица 7.4
Линейная регрессия. Зависимая переменная - Показатель-A
 
 
 
 
 
 
 
 

 
 
 
 
 
 
 
 
 

Оценки коэффициентов линейной регрессии
 
 
 
 
 
 

Переменная
Коэффициент
Среднекв.отклонение
t-значение
Нижняяоценка
Верхняяоценка
Эластичность
Бета-коэф-т
Дельта-коэф-т

Св. член
1.14685
0.253
4.532
0.878
1.416
0.000
0.000
0.000

Показатель-B
0.10944
0.039
2.782
0.068
0.151
0.487
0.614
0.783

Показатель-C
0.00035
0.001
0.632
0.000
0.001
0.068
0.099
0.127

Показатель-D
0.03568
0.075
0.475
-0.044
0.116
0.062
0.070
0.090

Кpитическое значения t-pаспpеделения пpи 21 степенях свободы (p=85%) = +1.064

 
 
 
 
 
 
 
 
 

Таблица остатков
 
 
 
 
 
 
 
 

номер
Факт
Расчет
Ошибкаабс.
Ошибкаотносит.
 
 
 
 

1
2.700
2.669
0.031
1.143
 
 
 
 

2
3.600
2.786
0.814
22.614
 
 
 
 

3
2.700
2.778
-0.078
-2.905
 
 
 
 

4
2.900
2.555
0.345
11.896
 
 
 
 

5
1.600
1.579
0.021
1.324
 
 
 
 

6
1.300
1.956
-0.656
-50.472
 
 
 
 

7
2.500
2.312
0.188
7.508
 
 
 
 

8
2.100
2.220
-0.120
-5.716
 
 
 
 

9
2.400
2.149
0.251
10.463
 
 
 
 

10
2.000
2.261
-0.261
-13.026
 
 
 
 

11
2.500
2.457
0.043
1.708
 
 
 
 

12
1.800
1.902
-0.102
-5.643
 
 
 
 

13
2.800
2.706
0.094
3.365
 
 
 
 

14
4.000
4.522
-0.522
-13.044
 
 
 
 

15
3.900
4.411
-0.511
-13.093
 
 
 
 

16
4.700
3.937
0.763
16.232
 
 
 
 

17
4.800
3.798
1.002
20.879
 
 
 
 

18
4.300
3.671
0.