Багатофакторний кореляційно-регресійний аналіз
У багатьох випадках на результативну ознаку впливає не один, а кілька факторів Між факторами існують складні взаємозв'язки, тому їхній вплив на результативну ознаку с комплексним, а не просто сумою ізольованих впливів
Багатофакторний кореляційно-регресійний аналіз дає змогу оцінити міру впливу на досліджуваний результативний показник кожного із введених у модель факторів при фіксованому положенні на середньому рівні інших факторів Важливою умовою с відсутність функціонального зв'язку між факторами
Математично завдання зводиться до знаходження аналітичного виразу, котрий якнайкраще відображував би зв'язок факторних ознак з результативною, тобто знайти функцію
EMBED Equation.3 =f(X1,X2,X3,... ,Хп).
Найскладнішою проблемою є вибір форми зв'язку, аналітичного виразу зв'язку, На підставі чого за наявними факторами визначають результативну ознаку-функцію Ця функція мас краще за інші відображати реальні зв'язки між досліджуваним показником і факторами. Емпіричне обгрунтування типу функції за допомогою графічного аналізу зв'язків для багатофакторних моделей майже непридатне. Форму зв'язку можна визначати добиранням функцій різних типів, але це пов'язане з великою кількістю зайвих розрахунків. Зважаючи на те, що будь-яку функцію багатьох змінних шляхом логарифмування або заміни змінних можна звести до лінійного вигляду, рівняння множинної регресії можна виразити у лінійній формі:
EMBED Equation.3 = a0 + a1X1 + a2X2 + …+anXn.
Параметри рівняння обчислюють способом найменших квадратів Так, для розрахунку параметрів рівняння лінійної двофакторноі регресії
EMBED Equation.3 = a0 + a1X1 + a2X2,
де EMBED Equation.3 — розрахункові значення результативної ознаки-функції; Х1 і Х2 — факторні ознаки; a0, al i a2 — параметри рівняння, які можна обчислити способом найменших квадратів, розв'язавши систему нормальних рівнянь:
EMBED Equation.3
Кожний коефіцієнт рівняння вказує на ступінь впливу відповідного фактора на результативний показник при фіксованому положенні решти факторів, тобто як зі зміною окремого фактора на одиницю змінюється результативний показник Вільний член рівняння множинної регресії економічного змісту не має.
Звернемося до прикладу Стаж роботи, тарифний розряд і денна заробітна плата десяти робітників підприємства характеризуються певними даними (табл.1) Треба встановити залежність заробітної плати Y від двох факторів, стажу роботи робітників X, і тарифного розряду Х2. Заповнимо розрахункову таблицю.
Таблиця 1. Розрахункові дані до визначення рівняння зв'язку
Підставимо знайдені дані в систему нормальних рівнянь:
106= 10а0 + 87а1 + 41 а2,
1183 = 87а0 + 1009а1 + 416а2;
502 = 41а0 + 416а1 + 189а2.
Для розв'язання системи нормальних рівнянь поділимо всі члени рівнянь на коефіцієнти при а0:
10,6 = а0 + 8,73, + 4,1а1;
13,6 = а0 + 11,6а1 + 4,78а2;
12,244 = а0 + 10,146а1 + 4,61а2.
Віднімемо від другого рівняння перше, а від третього рівняння -друге:
3 = 2,9а1 + 0,68а2;
-1,356 = -1,454а1-0,17а2.
Розділимо кожний член обох рівнянь на коефіцієнт при а1 і віднімемо від першого рівняння друге:
1,034 = а1 + 0,234а2
-
0,932 = а1 +0,117а2
0,102 = 0,117а2,
звідки
a2 = EMBED Equation.3 = 0,872.
Підставивши параметр а2 у рівняння, дістанемо
а1 = 1,034-0,234 * 0,872 = 0,83;
а0 = 10,6-8,7 * 0,83-4,1 * 0,872 = - 0,196.
Рівняння зв'язку, яке визначає залежність результативної ознаки від двох факторних, .має такий вигляд:
EMBED Equation.3 = -0,196 + 0,83х1+0,872х2.
Отже, зі збільшенням стажу роботи робітника на 1 рік денна заробітна плата підвищується на 0,83 грн., а при підвищенні тарифного розряду на одиницю денна заробітна плата зростає на 0,872 грн.
Підставивши в рівняння значення X1 і Х2, дістанемо відповідні значення змінної середньої (остання графа табл. 1), які досить близько відтворюють фактичні рівні заробітної плати Це свідчить про правильний добір форми математичного вираження кореляційного зв'язку між трьома досліджуваними ознаками
Однак на підставі коефіцієнтів регресії не можна судити, яка з факторних ознак найбільше впливає на результативну, оскільки коефіцієнти регресії між собою непорівняльні, адже їх виражено різними одиницями 3 метою виявлення порівняльної сили впливу окремих факторів та їхніх резервів, статистика обчислює часткові коефіцієнти еластичності EMBED Equation.3 , а також бета-коефіцієнти EMBED Equation.3 , за формулами:
EMBED Equation.3
де аі — коефіцієнт регресії при і-му факторі; EMBED Equation.3 — середнє значення і-го фактора; EMBED Equation.3 — середнє значення результативної ознаки; EMBED Equation.3 — середнє квадратичне відхилення і-го фактора; EMBED Equation.3 — середнє квадратичне відхилення результативної ознаки.
Часткові коефіцієнти еластичності є показують, на скільки процентів у середньому зміниться результативна ознака при зміненні на 1 % кожного фактора та фіксованому положенні інших факторів.
Для визначення факторів, які мають найбільші резерви поліпшення досліджуваної ознаки, з урахуванням ступеня варіації факторів, закладених у рівняння множинної регресії, обчислюють часткові EMBED Equation.3 -коефіцієнти, які показують, на яку частину середнього квадратичного відхилення змінюється результативна ознака при змінені відповідної факторної ознаки на значення її середнього квадратичного відхилення.
На підставі даних наведеного прикладу (табл. 1) обчислимо коефіцієнти еластичності і EMBED Equation.3 - коефіцієнти:
EMBED Equation.3
Аналіз часткових коефіцієнтів еластичності показує, що за абсолютним приростом найбільший вплив на заробітну плату робітників має стаж роботи — фактор Х1, зі збільшенням якого на 1 % заробіток підвищується на 0,68 %, а при збільшенні тарифного розряду на 1 % заробітна плата підвищується на 0,34 %
Для розрахунку EMBED Equation.3 - коефіцієнтів потрібно обчислити відповідні середи квадратичні відхилення:
EMBED Equation.3
тоді
EMBED Equation.3
Аналіз EMBED Equation.3 - коефіцієнтів показує, що на заробітну плату робітників найбільший вплив із двох досліджуваних факторів з урахуванням їхньої варіації мас фактор X1 — стаж роботи, бо йому відповідає найбільше значення EMBED Equation.3 - коефіцієнта
Для характеристики щільності зв'язку в множинній лінійній кореляції використовують множинний коефіцієнт кореляції
EMBED Equation.3
де EMBED Equation.3 — парні коефіцієнти лінійної кореляції:
EMBED Equation.3
Множинний коефіцієнт кореляції показує, яку частину загальної кореляції складають коливання, під впливом факторів Х1, Х2, ..., Хп, закладених у багатофакторну модель для дослідження.
Множинний коефіцієнт кореляції коливається в межах від 0 до ± 1 При R = 0 зв'язку між досліджуваними ознаками немає, при R = 1 — зв'язок функціональний.
Перш ніж розраховувати множинний коефіцієнт кореляції, потрібно обчислити парні коефіцієнти кореляції:
EMBED Equation.3
Високі значення парних коефіцієнтів кореляції свідчать про сильний вплив (окремо) стажу роботи і тарифного розряду на заробітну плату робітників.
На основі парних коефіцієнтів кореляції можна обчислити часткові коефіцієнти кореляції першого порядку:
EMBED Equation.3
Як бачимо з розрахунків часткових коефіцієнтів кореляції, зв'язок кожного фактора з досліджуваним показником за умови комплексної взаємодії факторів дещо слабший, але достатньо щільний.
Для виявлення щільності зв'язку між результативною ознакою і обома факторними ознаками водночас обчислюємо сукупний коефіцієнт множинної кореляції
EMBED Equation.3
Обчислений коефіцієнт множинної кореляції R = 0,998 показує, що між двома факторними і результативною ознаками існує достатньо щільний зв'язок.
Сукупний коефіцієнт множинної детермінації R2 = 0,995 свідчить про те, що варіація заробітної плати робітників на 99,5 % зумовлюється двома факторами (стажем роботи і тарифним розрядом), уведеними в кореляційну модель. Це означає, що вибрані фактори суттєво впливають на досліджуваний показник.
Аби поглибити економічний аналіз, збільшують кількість суттєвих факторів, які вводять у модель досліджуваного показника і будують багатофакторні рівняння регресії, використовуючи сучасні методи і засоби обчислювальної техніки.