Методи обробки експериментальних даних
Характерною особливістю експериментальних даних є наявність в них похибок експерименту. У зв’язку з цим аналіз і обробку даних експерименту здійснюють часто шляхом “згладження” цих даних (а тим самим зменшення впливу похибок) і побудови аналітичних (емпіричних) залежностей методом найменших квадратів.
Метод найменших квадратів
Нехай в результаті вимірювань в процесі експериментальних досліджень одержана таблиця залежності функції ? від аргументу х:
Таблиця 1
Треба знайти формулу, яка виражає цю залежність аналітично.
Можна, очевидно, застосувати метод інтерполювання: побудувати інтерполяційний многочлен (наприклад Лагранжа), значення якого в точках х1 , х2 , … хn будуть збігатися з відповідними значеннями ?(х) з таблиці 1. Проте збіг значень у вузлах не означає збігу характерів поведінки інтерпольованої функції та інтерполяційного многочленна (пам’ятаємо, що значення інтерполяційного многочленна поза вузлами інтерполяції може не збігатися зі значеннями функції). Крім того, результат вимірювання завжди містить похибку (деколи доволі велику, наприклад 50%). Тому інтерполяція тут, як правило, не підходить.
Поставимо задачу так: знайти функцію заданого вигляду:
у= F(х), (1)
яка в точках х1 , х2 , … хn набуває значень якнайближчих до табличних значень у1, у2,…, уn, але яка одночасно враховує характер експериментально знайденої функції.
Практично вигляд наближеної функції F можна визначити наступним способом: за таблицею 1 будують точковий графік функції ?(х), а відтак проводять плавну криву, яка відображає характер розташування експериментальних точок (див. рис. 1).
За одержаною таким чином кривою встановлюють (вибирають) вигляд наближеної функції (часто з числа простих за виглядом аналітичних функцій).
Одержану таким чином функцію F називають рівнянням регресії у на х. Це рівняння дозволяє знаходити значення функції ?, «згладжуючи» результати вимірювань, його можна використовувати для математичного моделювання.
Розглянемо один з найпоширеніших способів знаходження залежності (1).
Допустимо, що наближена функція F у точках х1 , х2 , … хn має значення у1, у2 , … уn . Ці значення, а також табличні значення функції ? – у1, у2 , … уn розглядатимемо як координати двох точок n-мірного простору. Тепер задача наближення функції може бути сформульована так: знайти таку функцію заданого вигляду (фактично – коефіцієнти функції F), щоб відстань між точками М(у1, у2 , … уn) і EMBED Equation.2 була найменшою. Застосувавши метрику еквівалентного простору одержуємо умову наближення:
Рис.1. Вигляд апроксимуючої експериментальні точки кривої
EMBED Equation.2 , (2)
або
EMBED Equation.2 (3)
Отже задача наближення функції ? тепер може бути сформульована так: для функції ?, заданої таблицею 1, квадратів відхилень (3) була найменшою.
Ця задача називається наближенням методом найменших квадратів (НК).
Процес наближення для експериментально встановленої функціональної залежності у= ?(х) за методом НК складається з двох етапів: спочатку вибирають вид формули і вже після цього визначають числові значення параметрів, для яких наближення буде найкращим.
Вид формули наближення вибирають виходячи з теоретичних міркувань або з числа елементарних функцій за виглядом точкового графіку.
Розглянемо метод знаходження параметрів наближеної функції в загальному вигляді на прикладі наближеної функції з трьома параметрами:
у= F(х, а, в, с) (4)
Сума квадратів різниць відповідних значень функцій ?(х) і F має вигляд: n
? [yi – F(xi, a, в, c)]²=Ф(a, в, c)
i=1
Ця сума є функцією трьох змінних (параметрів а, в, с). Задача зводиться до знаходження її мінімуму. Застосуємо необхідну умову
екстремуму: EMBED Equation.2 ; EMBED Equation.2 ; EMBED Equation.2 .
Оскільки: EMBED Equation.2 ; EMBED Equation.2 ; EMBED Equation.2 ,
одержимо систему EMBED Equation.2 (5)
Розв'язавши цю систему трьох рівнянь з трьома невідомими відносно параметрів а, в, с одержимо конкретний вигляд шуканої функції F(х, а, в, с), тобто параметри а, в, с.
Як видно з розглянутого прикладу, зміна кількості параметрів не міняє суті даного методу, а виразиться лише у зміні кількості рівнянь у системі (5).
Природно очікувати, що значення знайденої функції F(х, а, в, с) у точках х1 , х2 , … хn відрізнятимуться від табличних значень у1, у2 , … уn. Значення різниць: yi – F(xi, a, в, c)=?і (і=1, 2, …n), (6)
називають відхиленнями виміряних значень yi від обчислених за формулою (4).
Для знайденої емпіричної формули (4) по відношенню до таблиці 1 можна знайти суму квадратів відхилень
EMBED Equation.2 (7)
яка згідно з принципом найменших квадратів для заданого виду наближеної функції має бути найменшою.
З двох різних наближень однієї і тієї ж табличної функції ліпшим є те для якого сума (7) має менше значення. Отже величину ? можна використовувати для вибору найліпшої з розглядуваних функцій F, які наближують задану функцію?. При цьому слід пам'ятати, що параметр ? при наближенні експериментальних даних є, по-перше, розмірною величиною і, по-друге, не дозволяє оцінити якість кожного окремого наближення.
З метою оцінки якості наближення доцільно використовувати безрозмірний коефіцієнт кореляції ?, який можна визначити із залежності:
EMBED Equation.2 (8)
Чим ближче значення ? до одиниці, тим ближчі розрахункові значення ( EMBED Equation.2 ) до табличних (експериментальних) – у.
Для оцінки якості наближення можна використовувати також відносне середнє квадратичне відхилення:
EMBED Equation.2 (9)