Реферат на тему:
Гетероскедастичність
Виявлення гетероскедастичності та її природа
Розглянемо класичну лінійну багатофакторну модель
Як завжди,
Для застосування МНК при оцінюванні параметрів моделі раніше було сформульовано основні припущення, які на практиці можуть порушуватись.
У попередньому розділі розглядався особливий випадок багатофакторного регресійного аналізу, пов'язаний з проблемою мультиколінеарності. Тепер розглянемо інший особливий випадок, що стосується сталості дисперсії кожної випадкової величини щ (гомоскедастичність залишків).
Означення 5.1. Якщо дисперсія залишків стала для кожного спостереження, то це явище називається гомоскедастичністю:
Якщо це припущення не задовольняється в якомусь окремому випадку то маємо гетероскедастичність (помилки и. некорельовані, але мають несталу дисперсію).
Означення 5.2. Якщо дисперсія залишків змінюється для кожного спостереження або групи спостережень, то це явище називається ге-тероскедастичністю:
Розглянемо питання про доцільність припущення і про те, що відбувається, якщо це припущення не задовольняється.
Насамперед зауважимо, що сутність припущення про гомоскедас-тичність полягає в тому що варіація кожної випадкової складової ина-вколо її математичного сподівання не залежить від значення факторів х:
Форма гетероскедастичності залежить від знаків і значень коефіцієнтів у залежності
У прикладних дослідженнях, як правило, використовують зручне припущення, а саме в разі простої лінійної регресії гетероскедастичність має форму
Наслідки порушення припущення про гомоскедастичність:
1) неможливо знайти середньоквадратичне відхилення параметрів ?2 регресії, а отже, неможливо оцінити значущість параметрів;
2) неможливо побудувати довірчий інтервал для прогнозних значень у ;
3) отримані за МНК оцінки параметрів регресії не є ефективними (не мають найменшої дисперсії).
Зазначимо, що якщо незважаючи на гетероскедастичність ми використовуватимемо звичайні процедури перевірки гіпотез, то висновки можуть бути неправильними. Зрозуміло, гетероскедастичність є суттєвою проблемою, а тому потрібно вміти з’ясовувати її наявність.
Тестування наявності гетероскедастичності
Як і в разі мультиколінеарності, єдиних правил виявлення гетероскедастичності немає, а є різноманітні тести (критерії): критерій ц, параметричний та непараметричний тести Гольдфельда - Квандта, тест Глейсера, тест рангової кореляції Спірмана та ін. Розглянемо лише деякі з них.
Зауважимо, що інколи в ході проведення економетричних досліджень гетероскедастичність вгадується інтуїтивно або висувається як абсолютне припущення:
Наприклад, вивчаючи бюджет сім’ї, можна помітити, що дисперсія залишків зростає відповідно до зростання доходу. Отже, перший крок до виявлення гетероскедастичності - глибокий аналіз змісту досліджуваної проблеми.
Крім того, існує графічний метод тестування наявності гетероскедастичності, що ґрунтується на встановленні наявності систематичного зв’язку квадратів залишків регресійної моделі, побудованої на основі припущення про відсутність гетероскедастичності (графічний аналіз).
Параметричний тест Гольдфельда — Квандта
Зауваження. 1. Цей тест застосовується до великих вибірок. 2. Тест припускає нормальний розподіл і незалежність випадкових величин и..
1-й крок:
спостереження (вихідні дані) впорядкувати відповідно до величини елементів вектора х., який може спричинити зміну дисперсії залишків.
2-й крок:
відкинути спостережень, які розміщені всередині векторів вихідних даних
3-й крок:
побудувати дві моделі на основі звичайного МНК за двома створеними сукупностями спостережень обсягом за умови, що де т - кількість змінних.
4-й крок:
знайти суму квадратів залишків S1 і S2 за першою і другою моделями:
де щ і и2 - залишки відповідно за першою і другою моделями.
5-й крок:
розрахувати критерій який у разі виконання гіпотези про гомоскедастичність відповідатиме розподілу з
ступенями свободи;
значення критерію f порівняти з табличним значенням F-критерію при вибраному рівні значущості а і відповідних ступенях свободи;
Зауваження: чим більше значення Ґ, тим більша гетероскедастичність залишків.
Непараметричний тест Гольдфельда — Квандта
Цей тест базується на встановленні кількості піків значень залишків після впорядкування (ранжування) спостережень зал:... Якщо для всіх значень змінної залишки розподіляються приблизно однаково, то дисперсія їх однорідна і гетероскедастичність відсутня. Якщо вона змінюється, то гетероскедастичність присутня.
Зазначимо, що цей тест не цілком надійний для перевірки на гетероскедастичність. Однак він дуже простий і часто використовується для першої оцінки наявності гетероскедастичності множини спостережень.
Тест Глейсера
Перевірка на гетероскедастичність базується на побудові регресійної функції, що характеризує залежність величини залишків за модулем від пояснюючої змінної х-, яка може зумовити зміну дисперсії залишків.
Аналітична форма регресійних функцій може мати вигляд \u\=а0 +а1х., \u\=а0 +а1х-1, \u\=а0 +а1х12 і т.ін.
Рішення про відсутність гетероскедастичності залишків приймається на основі значущості коефіцієнтів а0 а1. Перевага цього методу полягає в можливості розрізняти випадок чистої і змішаної гетероскедастичності. Залежно від цього потрібно використовувати різні матриці S.
Оскільки явище гетероскедастичності пов’язане з тим, що змінюються дисперсії залишків, а коваріація між ними відсутня, то матриця S у співвідношенні має бути додатно визначеною й діагональною.
Приклад. Перевірити гіпотезу про відсутність гетероскедастичності для побудови моделі, яка характеризує залежність заощаджень від доходів населення. Статистичні дані наведено в таблиці.
Розв'язання. Ідентифікуємо змінні: у - заощадження, х - дохід. Специфікуємо модель у вигляді
де u - стохастична складова моделі.
Для перевірки гіпотези про відсутність гетероскедастичності залишків моделі застосуємо параметричний тест Гольдфельда - Квандта.
1-й крок:
спостереження впорядкуємо за зростанням за величиною доходу (вектор х), який може спричинити зміну дисперсії залишків.
2-й крок:
відкинемо с спостережень усередині вектора вихідних даних, де
с = %,п- кількість елементів вектора х Отже,
Отримаємо дві сукупності спостережень обсягом 184 = 7. Перша сукупність спостережень:
Друга сукупність спостережень:
3-й крок:
побудуємо дві моделі на основі звичайного МНК за двома ство-реними сукупностями спостережень:
4-й крок:
знайдемо суму квадратів залишків S1 і S2 за першою і другою моделями:
де u1 і u2 - залишки відповідно за першою і другою моделями. 5-й крок:
розрахуємо критерій
який у разі виконання гіпотези про гомоскедастичність відповідатиме ^-розподілу
ступенями свободи;
значення критерію f порівняємо з табличним значенням F-критерію при рівні значущості ? = 0,05 і відповідних ступенях свободи:
табл=Д0,05; 5) = 5,05.
Отже, МНК-оцінки параметрів регресійної моделі можуть застосовуватися для подальших досліджень.
Трансформування початкової моделі
Розглянемо питання усунення гетероскедастичності трансформуванням початкової моделі.
Припустимо, що за статистичними даними побудовано початкову регресійну модель і на базі будь-якого тесту встановлено наявність гетероскедастичності:
Для усунення гетероскедастичності початкову модель змінюють (трансформують) так, щоб помилки мали сталу дисперсію:
Трансформація моделі зводиться до зміни початкової форми моделі методом, який залежить від специфічної форми гетероскедастичності, тобто від форми залежності між дисперсіями залишків і значеннями незалежних змінних:
Розглянемо можливі випадки трансформації моделі на прикладі простої лінійної регресії. Нехай початкова модель де компоненти випадкового вектора и гетероскедастичні, але відповідають іншим класичним припущенням лінійної регресії.
Розглянемо такі випадки.
Випадок 1. Припустимо, що гетероскедастичність має форму
де k = const (тобто дисперсія залишків зростає пропорційно до х2). Із припущення випливає
Це означає, що трансформація моделі полягає в діленні початкової моделі.
Отже, трансформована модель має вигляд
Зазначимо, що параметр при змінній 1Д. у трансформованій моделі є перетином (вільним членом) початкової моделі, тоді як перетин трансформованої моделі є нахилом початкової.
Отже, нова випадкова величина моделі має скінченну сталу дисперсію k2. Таким чином, модель має гомоскедастичну випадкову змінну, що означає правомірність застосування класичного МНК для розрахунку невідомих параметрів трансформованої моделі.
Випадок 2. Припустимо, що гетероскедастичність має форму
де k = const (тобто дисперсія залишків зростає пропорційно до х). Із припущення випливає
Отже, трансформована модель має вигляд
Розглянемо
Отже, для трансформованої моделі випадкова величина у= гомоскедастична зі сталою дисперсією k2. Це означає, що, виконавши зазначене вище перетворення, ми виключили гетероскедастичність. Випадок 3. Припустимо, що гетероскедастичність має форму
(дисперсія зростає пропорційно до квадрата лінійної функції від х). Із припущення випливає
Допустима трансформація полягає в діленні початкової моделі на
Отже, трансформована модель має вигляд
Розглянемо
Отже, нова випадкова величина є гомоскедастичною із сталою дисперсією k2.
Загальний випадок. Припустимо, що гетероскедастичність має форму
Зазначимо, що така трансформація еквівалентна застосуванню зваженого методу найменших квадратів (ЗМНК), який є особливим випадком узагальненого методу найменших квадратів (УМНК). Суть ЗМНК полягає в мінімізації зваженої суми квадратичних відхилень:
Зазначимо також, що ЗМНК, застосований до початкової моделі, дає такі самі результати, що й МНК, застосований до трансформованої моделі.
Твердження. Оцінки трансформованої моделі мають меншу дисперсію (ефективніші), ніж оцінки, отримані із застосуванням МНК до початкової моделі.
Нарешті, потрібно пам’ятати, що гетероскедастичність може існувати за рахунок неврахованих факторів (поганої специфікації моделі). У цьому разі можливим рішенням є включення неврахованих факторів у модель. Сліпе застосування трансформації (без аналізу причин гетероскедастичності) зробить гомоскедастичною випадкову змінну, однак оцінки параметрів залишаться неправильними через неврахування важливих факторів.
Оцінювання параметрів багатофакторної регресійної моделі на основі узагальненого методу найменших квадратів
Розглянемо детальніше загальний випадок оцінювання параметрів моделі з гетероскедастичними залишками.
Запишемо узагальнену багатофакторну регресійну модель у мат-ричному вигляді де у вектор-стовпець залежної змінної розмірності (n х 1);
X - матриця незалежних змінних розмірності (nх(m + 1));
a - вектор-стовпець невідомих параметрів розмірності ((m + 1) х 1);
u вектор-стовпець випадкових помилок розмірності (n х 1).
Нехай виконуються всі припущення класичної лінійної багатофакторної моделі, за винятком припущення про гомоскедастичність похибок. Якщо до моделі (5.16) застосувати звичайний МНК, отримана оцінка параметрів буде незміщеною, обгрунтованою, однак не ефективною (не має найменшої дисперсії серед незміщених оці-нок).
За наявності гетероскедастичності для оцінювання параметрів моделі доцільно застосувати узагальнений метод найменших квадратів (метод Ейткена), вектор оцінювання якого має вигляд
Вектор a містить незміщену лінійну оцінку параметрів моделі, яка має найменшу дисперсію і матрицю коваріацій:
Зауваження. Для отримання УМНК-оцінок необхідно знати коваріаційну матрицю S вектора похибок, яка на практиці дуже рідко відома. Тому природно спершу оцінити матрицю S, а потім застосувати її оцінку у формулі. Цей підхід є суть узагальненого методу найменших квадратів.
Визначення матриці S. Оскільки явище гетероскедастичності пов’язане лише з тим, що змінюються дисперсії залишків, а коваріація між ними відсутня, то матриця S має бути діагональною, а саме
Зазначимо, що матриця S залежить від специфічної форми гетероскедастичності й може бути розрахована виходячи з припущень про залежність похибок від однієї із незалежних змінних (випадки 1-3).
Оскільки матриця S симетрична і додатно визначена, то при S = PP - 1 матриця Р має вигляд
Зауваження. Коефіцієнт детермінації не може бути задовільною мірою якості моделі в разі застосування УМНК (на відміну від класичної моделі). У загальному випадку значення коефіцієнта детермінації навіть не повинно перебувати в інтервалі [0,1], а додавання чи вилучення незалежної змінної (фактора) не обов’язково зумовлює його збільшення або зменшення.
Основні висновки щодо наявності гетероскедастичності в регресійній моделі
1. Якщо виявлено гетероскедастичність, а дисперсії невідомі, необхідно трансформувати початкову модель з метою усунення гетероскедастичності.
2. Якщо а2щ відомі (що, взагалі, рідкість), то невідомі параметри регресійної моделі розраховуються за МНК.
3. Якщо а2щ невідомі, але відомий вигляд залежності між а2щ та однією із незалежних змінних %., то параметри регресійної моделі розраховуються за УМНК.
4. Важливим є припущення про нормальний закон розподілу випадкової змінної и. Якщо це припущення порушується (або, як часто буває на практиці, ігнорується), то оцінки параметрів залишаються найкращими, однак ми не можемо визначити їх статистичну значущість (надійність) за допомогою класичних тестів значущості (t, f тощо), оскільки ці тести базуються на нормальному законі розподілу.
Список використаної літератури
Грубер Й. Економетрія: Вступ до множинної регресії та економетрії: У 2 т. - К: Нічлава, 1998-1999.
Джонстон Дж. Эконометрические методы. — М.: Статистика, 1980. — 444 с.
Доугерти К. Введение в эконометрику: Пер. с англ. — М.: ИНФРА-М, 1997. - 402 с.
Дрейпер П., Смит Г. Прикладной регрессионный анализ. — М.: Финансы и статистика, 1986. — Т. 1 — 365 с; Т. 2 — 379 с.
Емельянов А. С. Эконометрия и прогнозирование. — М.: Экономика, 1985. - С. 82-89.
Єлейко В. Основи економетрії. — Львів: "Марка Лтд", 1995. — 191с.
Кейн Э. Экономическая статистика и эконометрия. Введение в количественный экономический анализ. — М.: Статистика, 1977. — 254с.
Корольов О. А. Економетрія: Навч. посіб. — К: Європейський ун-т,2002. - 660 с.
Ланге О. Введение в эконометрию. — М.: Прогресс, 1964. — 360 с.
Лук'яненко I. Г., Краснікова Л. І. Економетрика: Підручник. — К.: Т-во "Знання", КОО, 1998. - 494 с
Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Навч. курс. - М.: Дело, 1997. - 248 с.
Маленво Э. Статистические методы эконометрии. — М.: Статистика, 1975. - 423 с.
Наконечний С. I., Терещенко Т .О., Романюк Т. П. Економетрія: Навч. посіб. - К: КНЕУ, 1997. - 352 с.
Тинтнер Г. Введение в эконометрию. — М.: Статистика, 1965. — 368 с.
Толбатое Ю. А. Економетрика: Підруч. для студ. екон. спец. вищ. навч. закл. — К.: Четверта хвиля, 1997. — 320 с.
Фишер Ф. Проблема идентификации в эконометрии. — М.: Статистика, 1978. - 224 с.
Хеш Д. Причинный анализ в статистических исследованиях. — М.: Финансы и статистика, 1981. — 224 с.
Венецкий И. Г., Венецкая В. И. Основные математико-статистические понятия и формулы в экономическом анализе: Справочник. — 2-е изд., перераб. и доп. — М.: Статистика, 1979. — 448 с.
Винн Р., Холден К. Введение в прикладной эконометрический анализ. — М: Финансы и статистика, 1981. — 294 с.
Геец В. М. Отраслевое прогнозирование: методологический и организационный аспекты. — К.: Наук, думка, 1990. — 120 с.
Гранберг А. Г. Динамические модели народного хозяйства. — М.: Экономика, 1985. — 204 с.
Гранберг А. Г. Статистическое моделирование и прогнозирование. — М.: Финансы и статистика, 1990. — 378 с.