Лабораторна робота № 4 “Мультиколінеарність” (2 години) 1. Мета роботи: Набуття практичних навичок тестування наявності мультиколінеарності в економетричних моделях і її усунення. 2. Задачі роботи : Тестування наявності мультиколінеарності у багатофакторній лінійній регресійній моделі на основі тесту Фаррара-Глобера. Усунення мультиколінеарності. 3. Завдання роботи і вихідні данні. Для деякого регіону виконується економетричне дослідження, метою якого є аналіз реального споживання населення y (в млн. грошових одиниць) в залежності від наступних трьох факторів: x1 - купівлі та оплати товарів і послуг (в млн. грошових одиниць), x2 – заощаджень (в % від загального доходу) і x3 - заробітної плати (в млн. грошових одиниць). Вважається, що залежність між зазначеними економічними показниками може бути представлена економетричною моделлю багатофакторної лінійної регресії. Дані вибіркових статистичних спостережень наведені нижче у таблиці. і y x1 x2 x3
1 14+K 9+0,1N 7,90+0,1N 16,78+0,1N
2 16+K 10+0,1N 9,04+0,1N 19,68+0,1N
3 15+K 11+0,1N 9,95+0,1N 21,56+0,1N
4 14+K 13+0,1N 9,22+0,1N 22,46+0,1N
5 20+K 13+0,1N 11,12+0,1N 22,50+0,1N
6 19+K 15+0,1N 13,47+0,1N 27,20+0,1N
7 22+K 14+0,1N 13,46+0,1N 28,52+0,1N
8 27+K 16+0,1N 12,57+0,1N 30,00+0,1N
9 29+K 18+0,1N 12,40+0,1N 29,56+0,1N
10 29+K 16+0,1N 13,20+0,1N 24,23+0,1N
11 30+K 14+0,1N 13,50+0,1N 25,00+0,1N
12 30+K 20+0,1N 14,52+0,1N 30,00+0,1N
13 31+K 21+0,1N 14,00+0,1N 32,15+0,1N
14 28+K 23+0,1N 15,00+0,1N 32,00+0,1N
15 31+K 20+0,1N 14,50+0,1N 33,00+0,1N
Ґрунтуючись на наведених статистичних даних : За допомогою тесту Фаррара-Глобера перевірити наявність мультиколінеарності між пояснюючими змінними моделі. При наявності мультиколінеарності запропонувати шляхи її вилучення. 4. Порядок виконання роботи. На основі вихідних даних заповнюються перші чотири стовпця таблиці 1. У таблиці 1 визначаються середні значення і стандартні відхилення всіх пояснюючих змінних моделі (функції MS Excel СРЗНАЧ, СТАНДОТКЛОНП). Виконується стандартизація (нормалізація) пояснюючих змінних. Елементи стандартизованих векторів пояснюючих змінних визначаються за наступною формулою: , ( 1 ) де n – число спостережень; m - число факторів моделі (пояснюючих змінних) ; - середнє арифметичне к-ї пояснюючої змінної; - стандартне відхилення к-ї пояснюючої змінної. Допоміжні розрахунки виконуються у таблиці 1. Для обчислення стандартизованих векторів пояснюючих змінних використовуються вбудована функція MS Excel НОРМАЛИЗАЦИЯ. На основі виконаних розрахунків формується матриця стандартизованих пояснюючих змінних і транспонована до неї матриця ( функція ТРАНСП ). Використовуючи вбудовану функцію МУМНОЖ обчислюється добуток матриць . Обчислюється кореляційна матриця пояснюючих змінних моделі r : . ( 2 ) Обчислюється визначник кореляційної матриці ( функція МОПРЕД ). Обчислюється розрахункове значення критерію ?2 : . ( 3 ) Для рівня значимості (=0,05 і ступеня вільності за статистичними таблицями ?2 - розподілу знаходиться табличне значення ?2табл. і порівнюється з фактичним розрахунковим. Робиться відповідний висновок Визначається матриця С, обернена до кореляційної матриці r (функція МОБР) : . ( 4 ) Для кожної пояснюючої змінної моделі розраховується F-критерій Фішера за наступною формулою : ( 5 ) де - елементи матриці C, які знаходяться на головній діагоналі. Для рівня значимості (= 0,05 і ступенів вільності v1= m-1 та v2= n-m за статистичними таблицями F - розподілу знаходиться критичне значення критерію Фішера Fкр. Табличне значення Fкр порівнюється з розрахунковими значеннями Fк і робляться відповідні висновки. Використовуючи матрицю C обчислюються часткові коефіцієнти кореляції між пояснюючими змінними моделі: ( 6 ) де j- елемент матриці С, що міститься у к –му рядку і j - тому стовпці; i - діагональні елементи матриці С. Слід зазначити, що враховуючи симетричність матриці часткових коефіцієнтів кореляції, у лабораторній роботі достатньо визначити тільки три часткові коефіцієнти кореляції : r12, r13 і r23. На основі знайдених часткових коефіцієнтів кореляції обчислюються розрахункові значення t- критерію Ст’юдента: ( 7 ) Як і у попередньому пункті слід обчислити тільки три значення t – статистики : t12, t13 і t23. Для рівня значимості (= 0,05 при ступені вільності (=n-m за статистичними таблицями t- розподілу Ст’юдента знаходиться критичне значення t- критерію Ст’юдента - tкр. Порівнюючи розрахункові значення з критичним робляться відповідні висновки. У разі виявлення наявності мультиколінеарності пропонуються шляхи її усунення. У лабораторній роботі у якості такого шляху слід застосувати вилучення з моделі однієї із змінних, які корелюють між собою. 5. Підготовка до роботи. Для успішного виконання лабораторної роботи студент повинен знати: мету і завдання роботи, порядок її виконання; ідею і алгоритм тесту Фаррара-Глобера; шляхи усунення мультиколінеарност; структуру кореляційної матриці для множинної лінійної регресії. Для успішного виконання лабораторної роботи студент повинен вміти: користуватися вбудованими функціями Excel СРЗНАЧ, СТАНДОТКЛОНП, НОРМАЛИЗАЦИЯ, КОРЕНЬ, LN, СТЕПЕНЬ, МОБР, МОПРЕД, МУМНОЖ, ТРАНСП ; користуватись статистичними таблицями F – розподілу, t – розподілу і - розподілу. Для успішного виконання лабораторної роботи студент повинен підготувати заготовку електронної таблиці з вихідними даними і заготовку допоміжної таблиці 1. Допоміжний матеріал. Таблиця 1 i
1
2
… … … … … … …
15
Середнє
--- --- ---
Стандартне відхилення
--- --- ---
7. Питання для контролю і самоконтролю. Що означає мультиколінеарність пояснюючих змінних економетричної моделі ? При моделюванні яких економічних явищ і процесів можлива мультиколінеарність ? Чим відрізняється повна мультиколінеарність від неповної ? Як впливає наявність мультиколінеарності на статистичні показники і оцінки параметрів моделі? Основні ознаки мультиколінеарності. Ідея і основні етапи тесту Фаррара-Глобера . Шляхи усунення мультиколінеарності.