ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ КАФЕДРА МАТЕМАТИКИ И ИНФОРМАТИКИ О Т Ч Е Т о результатах выполнения компьютерной лабораторной работы № 2 по теме: Множественный корреляционный анализ (используя ППП СтатЭксперт, Microsoft Excel, SPSS) Вариант № 8 Уфа, 2007 г. Задача 1 По данным, представленным в табл. 1, исследуется зависимость между величиной накладных расходов 40 строительных организаций Y (млн. руб.) и следующими тремя основными факторами: Х1 – объемом выполненных работ, млн. руб. Х2 – численность рабочих, чел. Х3 – фонд заработной платы, млн. руб. Таблица 7 № п/п Накладные расходы, млн. руб. Объем работ, млн. руб. Численность рабочих, чел. Фонд заработной платы рабочих, млн. руб.
1 3,5 11,9 980 5,754
2 4,0 12,1 675 5,820
3 3,1 11,2 1020 4,267
… … … … …
38 1,6 7,4 159 1,570
39 1,2 2,2 162 1,142
40 1,5 2,6 101 0,429
Задание: Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель для зависимой переменной «Накладные расходы» за счет значимых факторов. Рассчитать индекс корреляции R и оценить качество полученного уравнения регрессии с помощью коэффициента детерминации R2. Оценить статистическую значимость уравнения регрессии, используя критерий Фишера F (? = 0,05). Дать сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, ?- и ?-коэффициентов. Ранжировать предприятия по степени их эффективности. МНОЖЕСТВЕННЫЙ КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ Решение задачи с помощью ППП СтатЭксперт Корреляционный анализ Создать файл исходных данных в среде Excel. Пуск > Программы > Microsoft Excel. В появившейся книге внести данные. Для этого в ячейке А1 записать «X», в ячейке А2 «Y» и далее числовые данные (рис. 27).
Рис. 27 Сохранить таблицу данных в формате Excel (Файл > Сохранить). Свернуть окно Excel и перенести файл исходных данных в среду Word и сохранить в Word. Запуск программы «СтатЭксперт». Пуск > Программы > Olymp > СтатЭксперт > Включить макросы. На экране появится картинка «СтатЭксперт». Дать команду «Начало работы». Появится таблица программы «СтатЭксперт». Включить режим работы программы. Активизировать файл исходных данных и отметить в нем цифровые данные таблицы. Вызвать меню «СтатЭкс», затем – «Корреляция». Предварительная обработка данных. В окне «Установка блока данных» установить следующие параметры: ориентация таблицы «по строкам», наличие наименований снять все флажки (рис. 2). Нажать кнопку «Установить». В окне «Корреляционный анализ» перенести все показатели в правую часть окна с помощью кнопки «Добавить все». Убрать галочку «Построение графиков» (рис. 28). Нажать кнопку «Вычислить».
Рис. 28 В результате получили следующий протокол отчета в таб. 7.1. Таблица 7.1 Протокол корреляционного анализа
Проведем корреляционный анализ на основе полученной в программе «СтатЭксперт» матрицы парных коэффициентов (выделена в таблице 7.2 серым цветом): Таблица 7.2
Y X1 X2 X3
Y 1.000 0.869 0.682 0.780
X1 0.869 1.000 0.735 0.871
X2 0.682 0.735 1.000 0.611
X3 0.780 0.871 0.611 1.000
Установим значимость парного коэффициента корреляции между Y и каждым фактическим признаком Х. Для этого проверим значимость парных коэффициентов корреляции, используя t-критерий Стьюдента. Найдем tрасч, используя формулу: n = 28 – 4 = 25 Значения r берем из матрицы парных корреляций на рис. 35 Сравним tрасч с tтабл: Табличное значение критерия Стьюдента равно: tтабл = (? = 0,05, k = n – 2 = 23) = 2,0687. сравнивая числовые значения критериев, видно, что tрасч > tтабл, т.е. все полученные значения коэффициентов корреляции значимы. Установим наличие мультиколлинеарности между факторными признаками. rx2x2 = 0,735 < 0,8 rx3x2 = 0,871 > 0,8 => признак Х2 можно исключить rx3x3 = 0,611 < 0,8 Ослабим эффект мультиколлинеарности путем исключения одного из признаков в рассматриваемых парных коэффициентах корреляции. В результате данной операции остаются признаки Х1 (объем работ) и Х3 (фонд заработной платы), которые наиболее тесно связаны с Y (накладные расходы). Решение задачи с помощью ППП Microsoft Excel Выбрать команду Сервис > Анализ данных. В диалоговом окне «Анализ данных» выбрать инструмент «Корреляция», а затем щелкнуть на кнопку ОК (рис. 29).
Рис. 29 В диалоговом окне «Корреляция» в поле «Входной интервал» необходимо ввести диапазон ячеек $B$6:$E$30. Выбрать параметры вывода. В данном примере Новый рабочий лист. Нажать ОК (рис. 30).
Регрессионный анализ Задание 1 Создать файл исходных данных в среде Excel. Пуск > Программы > Microsoft Excel. В появившейся книге внести данные. Для этого в ячейке А1 записать «X», в ячейке А2 «Y» и далее числовые данные (рис. 27). Сохранить таблицу данных в формате Excel (Файл > Сохранить). Свернуть окно Excel и перенести файл исходных данных в среду Word и сохранить в Word. Запуск программы «СтатЭксперт». Пуск > Программы > Olymp > СтатЭксперт > Включить макросы. На экране появится картинка «СтатЭксперт». Дать команду «Начало работы». Появится таблица программы «СтатЭксперт». Включить режим работы программы. Активизировать файл исходных данных и отметить в нем цифровые данные таблицы. Вызвать меню «СтатЭкс», затем – «Регрессия». Предварительная обработка данных. В окне «Установка блока данных» установить следующие параметры: ориентация таблицы «по строкам», наличие наименований снять все флажки (рис. 2). Нажать кнопку «Установить». В окне «Регрессионный анализ» перенести показатели А, В, С, D в правую часть окна, нажав на кнопку «Добавить все». Установить зависимую переменную с помощью кнопки «Выбор» (рис. 31). Выделив в появившемся окне нужную переменную, нажать кнопку «Установить».
Рис. 31 Установить вид регрессии – линейная. Нажать «Вычислить». На запрос программы «Включить фактор времени» нажать Нет (рис. 32).
Рис. 32 Протокол отчета представлен в таб. 7.4: Таблица 7.4 Линейная регрессия. Зависимая переменная - Показатель-A