Метод аналітичного групування.Дисперсійний аналіз. За допомогою методу дисперсійного аналізу можна визначити роль систематичної та випадкової варіації в загальній варіації ознаки, а також дослідити роль фактора, покладеного в основу групування в зміні результативної ознаки. І етап При обґрунтуванні моделі кореляційного зв'язку необхідно вирішити два питання: 1) вибір факторних ознак; 2) визначення числа груп і розрахунок меж інтервалів. На практиці аналітичне групування часто виконується за принципом рівних частот, що дає можливість значно спрощувати подальший аналіз показників. II етап Здійснюється оцінка лінії регресії за допомогою визначення середніх значень результативної ознаки у кожній групі з врахуванням коливання факторної ознаки, при цьому групові середні можна обчислювати за вихідними не згрупованими ознаками, тобто за формулою середньої арифметичної простої. Крім того цій етап аналітичного групування дає можливість встановлювати кількісні співвідношення між результативнимиIII етап Вимір тісноти зв'язку ґрунтується на правилі складання дисперсії:
Де сігма квадратзрисочкою-середнєізгрупових дисперсій
Розглянемо економічний зміст цих показників. Загальна дисперсія () характеризує варіацію числових значень результативної ознаки, пов'язану із зміною всіх факторів, які на неї впливають. Міжгрупова дисперсія характеризує варіацію групових середніх, тобто варіацію результативної ознаки, яка пов'язана із зміною або варіацією групувальної ознаки (факторної зміни х). Середня з групових дисперсій () характеризує варіацію результативної ознаки, пов'язану з варіацією всіх факторних ознак, крім тієї, що покладена в основу групування. Таким чином загальна дисперсія результативної ознаки у складається з двох частин: 1) міжгрупової факторної дисперсії - ; 3) середньої з групових дисперсій (залишкової дисперсії) - Відношення факторної дисперсії до загальної характеризується тіснотою кореляційного зв'язку і таке співвідношення називається кореляційним ().
За статистичною структурою кореляційне відношення є часткою варіації результативної ознаки у, яка пов'язана з варіацією факторної ознаки х. IV етап Для перевірки істотності зв'язку результативних і факторних ознак використовують функціонально пов'язану з кореляційним відношенням характеристику - критерій Фішера або Р- критерій, які розраховуються за формулою:
де К- ступгнь вільності факторної дисперсії К=m-1; m - число, кількість груп; К - це ступінь вільності випадкової дисперсії К - загальний обсяг сукупності. Для спрощення розрахунку критерія існують таблиці критичних значень критерія Фішера. Кореляційне відношення може змінюватися від 0 до 1. Якщо , то це значить, що міжгрупова дисперсія теж дорівнює 0 (). Це можливо лише за умови, що всі групові середні однакові і кореляційний зв'язок між ознаками відсутній. Якщо =1, то це означає, що міжгрупова дисперсія дорівнює загальній дисперсії (), а середня з групових значень дорівнює 0 (=0). В такому випадку кожному значенню факторної ознаки відповідає єдине значення результативної ознаки, тобто зв'язок між ознаками тісний, істотний і функціональний. Якщо >0, то це не завжди є доказом наявності кореляційного зв'язку між ознаками. Можуть бути випадки, коли відмінне від 0 значення кореляційного відношення з'являється при випадковому розподілі статистичної сукупності на групи. Таблиці співзалежності Методи кореляційно-регресійного аналізу і методи аналітичного групування (дисперсійного аналізу) називаються ще параметричними, тому що вони базуються на використанні основних параметрів розподілу середніх величин і дисперсії. Якщо в кореляційно-регресійному аналізі всі ознаки це характеристики метричної шкали в методі аналітичного групування здійснюються на основі результативних ознак, то непараметричні методи застосовуються тоді, коли ознаки вимірюються за допомогою номінальної або порядкової шкали. Проте за допомогою непараметричних методів можна здійснити вимір не лише тісноти зв'язку, а й перевірити його істотність. Визначення тісноти схоластичного зв'язку ґрунтується на порівнянні частот або часток умовних розладів у таблицях співзалежності. Мірою тісноти схоластичного зв'язку є коефіцієнт взаємного узгодження - - критерій Персона
і - номер підгрупи за першою ознакою; j - номер підгрупи за другою ознакою; - число груп за першою ознакою; К2 - число груп за першою ознакою; - частість підгрупи і у групі j; - частість групи і у всій сукупності; mi- число одиниць у групі і. Для дослідження тісноти взаємозв'язку та його істотності обчислюється коефіцієнт співзалежності в основі якого лежить критерій Персона. Коефіцієнт співзалежності можна розрахувати двома способами: І. Формула Чупрова. С = II. Формула Крамера: Використання таблиць співзалежності дуже поширене при вивченні взаємозв'язку ознак різної природи в економіці, соціології, медицині та біології, В порівнянні з кореляційно-регресійним аналізом їх вибір можна лише аргументувати, дотриматись необхідних умов застосування, а отриманні результати легше інтерпретувати.