Тема 1
Статистика-наука,що дає можливість виявити закономірності,які відбув.в сусп-економ житті країни
Статистична сукупність-це множина елементів поєднаних спільними умовами існ і розвитку
Статистичний показник-
уззагальнююча кількісна х-ка соц-екон явищ у конкретних умовах місця і часу
Тема 4
1Абсолютні та відносні величини.
2.Середні вел.
3. Мода і медіана
1. Абсолютні величини – це такі величини, які показують розміри, обсяги, рівні суспільних явищ в абсолютному вимірі.
Можуть виражатися за допомогою натуральних одиниць вимірювань і у вартісних одиницях виміру.
Облік показників проводять за допомогою натуральних показників і називають обліком натурального виразу, а облік вартісних показників – обліком вартісного виразу.
Для аналізу явищ і процесів буває недостатньо лише абсолютних показників, тому статистика використовує відносні величини, які характеризують кількісну величину оцінки певних статистичних даних.
2. Для вивчення соціально-економічних явищ і процесів, для характеристики статистичної сукупності необхідно мати узагальнені показники, які б могли описувати певні явища або сукупність в цілому, для цього використовують середні величини – такі показники, які узагальнено характеризують будь-які явища і ознаки, визначають рівень варіюючої ознаки в якісно однорідній сукупності.
Середньо арифметична розраховується у таких випадках, коли обсяг ознак для статистичної сукупності є сумою індивідуального значення її окремих елементів.
Для дослідження розвитку соціально-економічних явищ в статистиці крім середньої арифметичної використовують наступні види середніх:
-середня гармонійна обернена величина до середньої арифметичної або ж розраховується з обернених величин.
-Середня геометрична використовується в рядах динаміки або для визначення зміни досліджених показників або середнього темпу використання.
-Середня квадратична використовується в рядах розподілу, для вираження середнього значення ознаки в квадратних одиницях.
-Середня структурна використовується в рядах розподілу для характеристики інтенсивності дослідженого явища – мода, медіана.
-Середня хронологічна – є допоміжної до середньої геометричної, використовується в рядах динаміки для розрахунку наприклад середньої вартості основних фондів, середньої чисельності персоналу х1, х2, хп – значення показника за відповідні періоди часу
3. Мода – (Мо) – це значення варіанти, яке найчастіше зустрічається в ряді розподілу. В дискретному ряді розподілу моду можна відшукати візуально. В інтервальному ряді розподілу моду обчислюють на основі модального інтервалу.
Приблизне значення моди визначають за наступною формулою:
Мо = Хмо + Імо*fмо – fмо-1/ (fмо – fмо-1) + (fмо – fмо+1), де Хмо –нижня границя модального інтервалу;
Імо – ширина (розмір) модального інтервалу;
fмо - частота модального інтервалу;
fмо-1 - частота попереднього (перед модального інтервалу)
fмо+1 –частота інтервалу наступного (за модальним);
Медіана – це значення варіанти , яке ділить ранжований ряд на дві рівних за чисельністю частини.
Коли ряд розподілу містить парне число членів, то медіана дорівнює середній величині з двох значень розташованих в центрі ряду. Для знаходження медіани в дискретному ряді розподілу спочатку обчислюється півсума частот, а потім визнач., яка варіанта припадає на неї. Для інтервального ряду розподілу приблизне значення медіани розраховується за наступною формулою:
Ме = Хме + Іме*?f/2 - fме-1/ fме;
де Хме - –нижня границя медіанного інтервалу;
Іме - ширина (розмір) медіанного інтервалу;
?f/2 – півсума накопичених частот;
fме-1 – сума накопичених частот інтервалів, які передують медіанному;
fме - частота медіанного інтервалу.
Тема 5
1.Ряд розподілу
2Дисперсія, СЛВ.
1. Ряд розподілу утворюється в результаті групування статистичних показників. Він представляє собою упорядковану послідовність пар елементів «варіанта-частота».
Варіанта – це окреме значення групувальної ознаки.
Частота – це кількість елементів в групі з відповідними значеннями або рівнями ознаки.
Прикладом ряду розподілу можуть бути згруповані результати складання іспиту з дисципліни статистика.
Замість частоти в статистичних розрахунках іноді зручніше вживати частку, яка може бути виражена коефіцієнтом або відсотком.
В залежності від значення ознаки ряди розподілу бувають:
Атрибутивними – розподіл за якісною ознакою;
Варіаційними – розподіл за кількісною ознакою.
Варіаційні ряди можуть бути:
Дискретними - побудовані на перервних або дискретних ознаках. Дискретною назив. така ознака, яка має певні значення між якими не можу бути ніяких інших(Приклад: розподіл сімей в Україні за кількістю дітей);
Інтервальними рядами розподілу є такі, які будуються на неперервних ознаках, що можуть приймати значення в певних межах і виражатися лише приблизно (Приклад: ріст людини 1,0 – 1,1; 1,1 – 1,2…).
Графічно ряди розподілу можуть зображатися:
Дискретний ряд за допомогою полігону;
Варіаційний ряд розподілу за допомогою гістограми.
До характеристики центру ряду розподілу належить: мода і медіана.
2. До основних характеристик варіації належать:
Розмах варіації – це різниця між найбільшим і найменшим значенням ознаки в статистичній сукупності.
R = Хmax – X min;
Середньо–лінійне відхилення – може розраховуватися для середньої постої і зваженої величини.
Проста:
d = ?| Xi – Xсер.|/n;
Зважена:
d = ?| Xi – Xсер.|*f/?f;
Дисперсія – середній квадрат відхилень індивідуальних значень ознаки від середньої величини.
Проста:
?2 = ?(Xi – Xсер.)2/n;
Зважена:
?2 = ?(Xi – Xсер.)2*f/?f;
Середньоквадратичне відхилення:
Проста:
? = ?2 = ?(Xi – Xсер.)2/n;
Зважена:
?=?2 = ?(Xi – Xсер.)2*f/?f;
Коефіцієнт варіації:
Розрах. за середньо–лінійним відхиленням:
Vd = d/Xser* 100%;
За середньоквадратичним відхиленням:
V? = ?/Xser* 100%;
Коефіцієнт асиміляції:
VR = R/Xser* 100%.
Основні властивості дисперсії:
Якщо всі значення ознаки збільшити на будь-яке постійне число а ,то дисперсія від цього не зміниться;
Якщо всі значення ознаки збільшити в будь-яке число разів k, то дисперсія збільшиться в k2 разів;
Сума квадратичних відхилень індивідуальних значень ознаки від середньої величини завжди менша суми квадратичних відхилень
індивідуальних значень ознаки від будь-якого постійного числа а, якщо х не дорівнює а;
4.Якщо всі значення частот зменшити або збільшити на будь-яке постійне число а, то дисперсія від цього не зміниться;
5.Дисперсія дорівнює різниці між середнім квадратом індивідуальних значень ознак і квадратом їх середніх величин.
У разі правосторонньої асиметрії-

У разі лівосторонньої асиметрії

У дискретному ряду розподілу медіана визначається:
як значення ознаки, для якої накопичена частота перевищує половину обсягу сукупності
Тема
1.Види зв’язків
2.кореляційний аналіз
3.Аналіз таблиць
Метод аналітичного групування.Дисперсійний аналіз.
За допомогою методу дисперсійного аналізу можна визначити роль систематичної та випадкової варіації в загальній варіації ознаки, а також дослідити роль фактора, покладеного в основу групування в зміні результативної ознаки. І етап
При обґрунтуванні моделі кореляційного зв'язку необхідно вирішити два питання:
1) вибір факторних ознак;
2) визначення числа груп і розрахунок меж інтервалів. На практиці аналітичне групування часто виконується за принципом рівних частот, що дає можливість значно спрощувати подальший аналіз показників. II етап
Здійснюється оцінка лінії регресії за допомогою визначення середніх значень результативної ознаки у кожній групі з врахуванням коливання факторної ознаки, при цьому групові середні можна обчислювати за вихідними не згрупованими ознаками, тобто за формулою середньої арифметичної простої. Крім того цій етап аналітичного групування дає можливість встановлювати кількісні співвідношення між результативнимиIII етап
Вимір тісноти зв'язку ґрунтується на правилі складання дисперсії:

Де сігма квадратзрисочкою-середнєізгрупових дисперсій

Розглянемо економічний зміст цих показників. Загальна дисперсія () характеризує варіацію числових значень
результативної ознаки, пов'язану із зміною всіх факторів, які на неї впливають.
Міжгрупова дисперсія характеризує варіацію групових середніх, тобто варіацію результативної ознаки, яка пов'язана із зміною або варіацією групувальної ознаки (факторної зміни х). Середня з групових дисперсій () характеризує варіацію результативної ознаки, пов'язану з варіацією всіх факторних ознак, крім тієї, що покладена в основу групування.
Таким чином загальна дисперсія результативної ознаки у складається з двох частин:
1) міжгрупової факторної дисперсії - ;
3) середньої з групових дисперсій (залишкової дисперсії) -
Відношення факторної дисперсії до загальної характеризується тіснотою кореляційного зв'язку і таке співвідношення називається кореляційним ().

За статистичною структурою кореляційне відношення є часткою варіації
результативної ознаки у, яка пов'язана з варіацією факторної ознаки х.
IV етап
Для перевірки істотності зв'язку результативних і факторних ознак
використовують функціонально пов'язану з кореляційним відношенням
характеристику - критерій Фішера або Р- критерій, які розраховуються за
формулою:

де К- ступгнь вільності факторної дисперсії
К=m-1;
m - число, кількість груп;
К - це ступінь вільності випадкової дисперсії
К - загальний обсяг сукупності.
Для спрощення розрахунку критерія існують таблиці критичних значень критерія Фішера.
Кореляційне відношення може змінюватися від 0 до 1. Якщо
, то це значить, що міжгрупова дисперсія теж дорівнює 0 (). Це можливо лише за умови, що всі групові середні однакові і кореляційний зв'язок між ознаками відсутній. Якщо =1, то це означає, що міжгрупова дисперсія дорівнює загальній
дисперсії (), а середня з групових значень дорівнює 0 (=0). В
такому випадку кожному значенню факторної ознаки відповідає єдине значення результативної ознаки, тобто зв'язок між ознаками тісний, істотний і функціональний.
Якщо >0, то це не завжди є доказом наявності кореляційного зв'язку між ознаками. Можуть бути випадки, коли відмінне від 0 значення кореляційного відношення з'являється при випадковому розподілі статистичної сукупності на групи.
Таблиці співзалежності
Методи кореляційно-регресійного аналізу і методи аналітичного групування (дисперсійного аналізу) називаються ще параметричними, тому що вони базуються на використанні основних параметрів розподілу середніх величин і дисперсії.
Якщо в кореляційно-регресійному аналізі всі ознаки це характеристики метричної шкали в методі аналітичного групування здійснюються на основі результативних ознак, то непараметричні методи застосовуються тоді, коли ознаки вимірюються за допомогою номінальної або порядкової шкали. Проте за допомогою непараметричних методів можна здійснити вимір не лише тісноти зв'язку, а й перевірити його істотність.
Визначення тісноти схоластичного зв'язку ґрунтується на порівнянні частот або часток умовних розладів у таблицях співзалежності. Мірою тісноти схоластичного зв'язку є коефіцієнт взаємного узгодження - - критерій Персона

і - номер підгрупи за першою ознакою; j - номер підгрупи за другою ознакою; - число груп за першою ознакою; К2 - число груп за першою ознакою; - частість підгрупи і у групі j;
- частість групи і у всій сукупності; mi- число одиниць у групі і.
Для дослідження тісноти взаємозв'язку та його істотності обчислюється коефіцієнт співзалежності в основі якого лежить критерій Персона.
Коефіцієнт співзалежності можна розрахувати двома способами:
І. Формула Чупрова.
С =
II. Формула Крамера:
Використання таблиць співзалежності дуже поширене при вивченні взаємозв'язку ознак різної природи в економіці, соціології, медицині та біології, В порівнянні з кореляційно-регресійним аналізом їх вибір можна лише аргументувати, дотриматись необхідних умов застосування, а отриманні результати легше інтерпретувати.