Як скласти рівняння регресії
Як лікар встановлює діагноз? Він розглядає сукупність ознак (симптомів), а потім приймає рішення про хвороби. Насправді, він всього лише робить певний прогноз, спираючись на деяку сукупність ознак. Це завдання легко формалізувати. Очевидно, що як встановлені симптоми, так і діагнози в якійсь мірі випадкові. Саме з такого роду первинних прикладів починається побудова регресійного аналізу.
1
Основне завдання регресійного аналізу - встановлення прогнозів про значення будь-якої випадкової величини, на основі даних про інший величиною. Нехай безліч факторів, що впливають на прогноз випадкова величина - Х, а безліч прогнозів - випадкова величина Y. Прогноз повинен бути конкретним, тобто необхідно вибрати значення випадкової величини Y = y. Це значення (оцінка Y = y *) вибирається на основі критерію якості оцінки (мінімуму дисперсії).
2
За оцінку в регресійному аналізі беруть апостеріорне математичне очікування. Якщо щільність ймовірності випадкової величини Y позначити p (y), то апостериорная щільність позначається як p (y | X = x) або p (y | x). Тоді y * = MY = yp (y | x) dy (мається увазі інтеграл по вcем значенням). Дана оптимальна оцінка y *, розглянута як функція х, називається регресією Y на X.
3
Будь-прогноз може залежати від безлічі факторів, виникає багатофакторна регресія. Однак в даному випадку слід обмежитися однофакторной регресією, пам`ятаючи, що в деяких випадках набір прогнозів традиційний і може бути розглянутий як єдиний у всій своїй сукупності (скажімо ранок - це схід сонця, закінчення ночі, найвища точка роси, найсолодший сон ...) .
4
Найбільш широке поширення набула лінійна регресія y = a + Rx. Число R називається коефіцієнтом регресії. Рідше зустрічається квадратична - y = з + bx + ax ^ 2.
5
Визначення параметрів лінійної і квадратичної регресії можна здійснити за допомогою методу найменших квадратів, який ґрунтується на вимозі мінімальної суми квадратів відхилень табличній функції від апроксимуючої величини. Його застосування для лінійної і квадратичної апроксимацій призводить до систем лінійних рівнянь щодо коефіцієнтів (див. Рис. 1а та 1b):
6
Проводити обчислення «вручну» вкрай складно. Тому доведеться обмежитися самим коротким прикладом. Для практичної роботи вам буде потрібно використовувати програмне забезпечення, призначене для розрахунку мінімальної суми квадратів, якого, в принципі, досить багато.
7
Приклад. Нехай фактори: х1 = 0, х2 = 5, х3 = 10. Прогнози: y1 = 2,5, y2 = 11, y = 23. Знайти рівняння лінійної регресії. Рішення. Складіть систему рівнянь (див. Рис. 1а) і вирішите його будь-яким способом.3a + 15R = 36,5 і 15а + 125R = 285. R = 2,23- a = 3,286. y = 3,268 + 2,23.
Зверніть увагу
Зауваження. Для встановлення лінійної регресії можна використовувати кореляційний аналіз.
Статті за темою "Як скласти рівняння регресії"
Оцініть, будь ласка статтю