Змішана модель

Змішана модель — це статистична модель, що містить як фіксовані, так і випадкові ефекти. Ці моделі використовують в широкому діапазоні дисциплін, зокрема, у галузі фізичних, біологічних і соціальних наук. Вони особливо корисні в ситуаціях, коли повторні виміри застосовуються до тих же статистичних одиниць. Завдяки перевагам змішаних моделей у роботі з відсутніми значеннями, їм часто віддають перевагу, на відмінну від більш традиційних підходів, таких як дисперсний аналіз.

Визначення[ред. | ред. код]

У матричному вигляді змішана модель має вигляд:

{\boldsymbol {y}}=X{\boldsymbol {\beta }}+Z{\boldsymbol {u}}+{\boldsymbol {\epsilon }}

де

${\boldsymbol {y}}$ — це відомий вектор спостережень, із середнім значенням: $E({\boldsymbol {y}})=X{\boldsymbol {\beta }}$ ;
${\boldsymbol {\beta }}$ — це невідомий вектор фіксованих ефектів ;
${\boldsymbol {u}}$ — це невідомий вектор випадкових ефектів, із середнім значенням $E({\boldsymbol {u}})={\boldsymbol {0}}$ та коваріаційною матрицею $\operatorname {var} ({\boldsymbol {u}})=G$ ;
${\boldsymbol {\epsilon }}$ це невідомий вектор випадкових помилок, із середнім значенням $E({\boldsymbol {\epsilon }})={\boldsymbol {0}}$ і $\operatorname {var} ({\boldsymbol {\epsilon }})=R$ ;
$X$ і $Z$ є відомими матричними моделями, що стосуються спостережень ${\boldsymbol {y}}$ до ${\boldsymbol {\beta }}$ і ${\boldsymbol {u}}$ , відповідно.

Оцінка[ред. | ред. код]

Сумарна густина ${\boldsymbol {y}}$ і ${\boldsymbol {u}}$ має вигляд: $f({\boldsymbol {y}},{\boldsymbol {u}})=f({\boldsymbol {y}}|{\boldsymbol {u}})\,f({\boldsymbol {u}})$ . Припустимо, що ${\boldsymbol {u}}\sim {\mathcal {N}}({\boldsymbol {0}},G)$ , ${\boldsymbol {\epsilon }}\sim {\mathcal {N}}({\boldsymbol {0}},R)$ і $Cov({\boldsymbol {u}},{\boldsymbol {\epsilon }})={\boldsymbol {0}}$ , тоді максимізація сумарної густини ${\boldsymbol {\beta }}$ і ${\boldsymbol {u}}$ дає рівняння змішаної моделі Хендерсона:^[1]^[2]^[3]

{\begin{pmatrix}X'R^{-1}X&X'R^{-1}Z\\Z'R^{-1}X&Z'R^{-1}Z+G^{-1}\end{pmatrix}}{\begin{pmatrix}{\hat {\boldsymbol {\beta }}}\\{\hat {\boldsymbol {u}}}\end{pmatrix}}={\begin{pmatrix}X'R^{-1}{\boldsymbol {y}}\\Z'R^{-1}{\boldsymbol {y}}\end{pmatrix}}

Розв'язки цього рівняння $\textstyle {\hat {\boldsymbol {\beta }}}$ і $\textstyle {\hat {\boldsymbol {u}}}$ є найкращими лінійними оцінками для ${\boldsymbol {\beta }}$ і ${\boldsymbol {u}}$ відповідно, що є наслідком з теореми Гаусса — Маркова.

Приклад[ред. | ред. код]

Уявімо, що ми хочемо дослідити зміну ваги пацієнтів протягом року. У дослідженні прийняло участь 10 пацієнтів $i=1,...,10$ які вимірювали свою вагу кожного місяця $t=1,...,12$ . Тобто ми маємо $10*12=120$ значень ваги $Y_{it}$ .

Пунктирна лінія на графіку зображує модель звичайної лінійної регресії. Це рівняння не враховує відмінностей у вимірах ваги кожного пацієнта, іншими словами, воно не враховує той факт, що дані утворюють кластери, і обчислює значення так, ніби вони отримані від одного єдиного суб'єкта. Кольорові лінії представляють рівняння, побудовані на основі 12 вимірювань кожного пацієнта. Ми бачимо, що кожен пацієнт мав свою початкову вагу (інтерцепт) і різний тренд зміни ваги (кут нахилу прямої).

Змішана модель відрізняється від звичайної лінійної регресії тим, що вона враховує кластеризацію даних і вимірює варіативність значень ваги, яка виникає від різниць між пацієнтами.

Існує модель випадкового інтерцепту (англ. random intercept model), яка враховує початкове значення ваги для кожного унікального пацієнта, та модель випадкового нахилу (англ. random slope model), яка враховує, що вага кожного пацієнта змінюється по-різному з часом. Змішана модель може включати як випадковий інтерцепт, так і випадковий нахил.

Див. також[ред. | ред. код]

Посилання[ред. | ред. код]

↑ Robinson, G.K. (1991). That BLUP is a Good Thing: The Estimation of Random Effects. Statistical Science. 6 (1): 15—32. doi:10.1214/ss/1177011926. JSTOR 2245695.
↑ L. Dale Van Vleck. Charles Roy Henderson, April 1, 1911 – March 14, 1989 (PDF). United States National Academy of Sciences. Архів оригіналу (PDF) за 7 червня 2011. Процитовано 29 квітня 2020.
↑ Henderson, C R (1973). Sire evaluation and genetic trends (PDF). Journal of Animal Science. American Society of Animal Science. 1973: 10—41. Процитовано 17 серпня 2014.^{[недоступне посилання]}

Подальше читання[ред. | ред. код]

Gałecki, Andrzej; Burzykowski, Tomasz (2013). Linear Mixed-Effects Models Using R: A Step-by-Step Approach. New York: Springer. ISBN 978-1-4614-3900-4.
Milliken, G. A.; Johnson, D. E. (1992). Analysis of Messy Data: Vol. I. Designed Experiments. New York: Chapman & Hall.
West, B. T.; Welch, K. B.; Galecki, A. T. (2007). Linear Mixed Models: A Practical Guide Using Statistical Software. New York: Chapman & Hall/CRC.

[GKR1991-1] Robinson, G.K. (1991). That BLUP is a Good Thing: The Estimation of Random Effects. Statistical Science. 6 (1): 15—32. doi:10.1214/ss/1177011926. JSTOR 2245695.

[LDVV1989-2] L. Dale Van Vleck. Charles Roy Henderson, April 1, 1911 – March 14, 1989 (PDF). United States National Academy of Sciences. Архів оригіналу (PDF) за 7 червня 2011. Процитовано 29 квітня 2020.

[3] Henderson, C R (1973). Sire evaluation and genetic trends (PDF). Journal of Animal Science. American Society of Animal Science. 1973: 10—41. Процитовано 17 серпня 2014.^{[недоступне посилання]}

[1]

[2]

[3]

Змішана модель

Зміст

Визначення[ред. | ред. код]

Оцінка[ред. | ред. код]

Приклад[ред. | ред. код]

Див. також[ред. | ред. код]

Посилання[ред. | ред. код]

Подальше читання[ред. | ред. код]

Навігаційне меню

Змішана модель

Визначення[ред. | ред. код]

Оцінка[ред. | ред. код]

Приклад[ред. | ред. код]

Див. також[ред. | ред. код]

Посилання[ред. | ред. код]

Подальше читання[ред. | ред. код]

Навігаційне меню

Пошук