Селективне упередження

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Селекти́вне упере́дження або упере́дження відбо́ру (англ. Selection bias) — це статистичне упередження, коли існує помилка у формуванні вибірки, наприклад відбір індивідуумів або груп для участі у науковому дослідженні.[1] Його також деколи називають ефект відбору. Фраза «упередження відбору» найчастіше використовується для позначення викривлення статистичного аналізу, яке виникло внаслідок обраного методу отримання зразків. Якщо упередження відбору не брати до уваги, деякі висновки дослідження можуть бути неправильними.

Типи[ред. | ред. код]

Нижче наведені деякі типи селективного упередження:

Упередження вибірки[ред. | ред. код]

Упередження вибірки — це систематична помилка, спричинена невипадковою вибіркою популяції,[2] яка спричиняє те, що деякі учасники популяції будуть включені до вибірки з меншою ймовірністю, ніж інші, що приводить до упередженої вибірки. Упереджена вибірка визначається як вибірка з популяції (будь-то людська спільнота або нелюдські фактори), в якій не всі учасники рівно збалансовані або об'єктивно представлені.[3] Упередження вибірки як правило класифікується як підтип селективного упередження,[4] і деколи спеціально називається упередження селективної вибірки,[5][6][7] однак деякі науковці виділяють його в окреме упередження.[8]

Аргументація для виділення в окреме упередження: упередження вибірки спотворює зовнішню дійсність (валідність) тесту (можливість поширити його результати на популяцію), а селективне упередження переважно стосується внутрішньої дійсності (валідності) стосовно різниць або подібностей у досліджуваній вибірці. При такому поясненні, помилки, які відбуваються в процесі відбору учасників вибірки або когорти, спричиняють упередження вибірки, а помилки у процесі після такого відбору, спричиняють селективне упередження.

Приклади упередження вибірки включають самовибірку (включення себе у групу, що порушує принцип ймовірності), попереднє «прослуховування» учасників експерименту, відкидання частини учасників експерименту або тестів, які не були завершені, та упередження міграції, коли відкидаються учасники, які недавно переїхали до території, щодо якої проводиться дослідження.

Часовий інтервал[ред. | ред. код]

  • Припинення експерименту дочасно у момент, коли були отримані результати, що підтримують бажаний висновок.
  • Припинення тесту дочасно в екстремальному значенні (часто з етичних причин), однак, екстремальне значення часто досягаються змінною з найбільшою дисперсією, навіть якщо всі змінні мають однакову середню.

Дані[ред. | ред. код]

  • Поділ даних зі знанням критеріїв розподілу, а потім їх аналіз за допомогою тестів, призначених для випадкового розподілу.
  • Відкидання «поганих» даних на довільних підставах, а не відповідно до раніше задекларованих або загально визнаних критеріїв.
  • Відкидання «крайнощів» на статистичних підставах, які, однак, не беруть до уваги важливу інформацію, що може бути отримана від «диких» спостережень.[9]

Дослідження[ред. | ред. код]

  • Відбір досліджень, які будуть включені в метааналіз (див.також комбінаторний метааналіз[en]).
  • Здійснення серії однакових експериментів (повторення), однак включення до звіту лише тих, які дали найбільш бажані результати, а записи про решту при цьому, наприклад, перейменовуються в «калібраційні тести», «помилка інструментарію» або «пробні дослідження».
  • Презентування найбільш значущого результату відсівання даних (неправильне використання добування даних) наче це був один єдиний експеримент (логічно це те саме, що й у пункті вище, але як правило вважається більш чесним).

Відсів[ред. | ред. код]

Упередження відсіву — це підтип селективного упередження, який є наслідком відсіву (втрати учасників)[10], тобто відкидання тих піддослідних/тестів, які не добігли до кінця. Включає "відмову", "відсутність відповіді" (нижчий процент відповіді[en]) та "порушників протоколу". В результаті отримуються упереджені результати, які не вірно показують вплив (поширеність) та/або наслідки. Наприклад, при тестуванні нової дієти, дослідник може просто відкинути всіх, хто «випаде» з тестування, але більшість з них є саме тими, для кого така дієта не спрацювала. Різна втрата учасників у тестовій та контрольній групі може змінити характеристики цих груп та результати тестування незалежно від того, що вивчається.[10]

Вибірка спостерігача[ред. | ред. код]

Дані фільтруються не лише за рахунок структури дослідження та виміру, а й за рахунок важливої передумови — необхідності існування дослідника. В ситуаціях, коли наявність дослідника або дослідження корелює зі спостереженням даних, виникають селективні ефекти, необхідно застосування антропного принципу[11].

Прикладом є свідоцтва про минулі події зіткнення Землі з великим космічним тілом: якщо великі зіткнення спричиняють масове вимирання та екологічні порушення, які протягом тривалого часу заважають еволюції розумного спостерігача, ніхто не може побачити свідчення відносно недавніх зіткнень (оскільки такі зіткнення не дали б розвинутися розумному спостерігачу). Тому в історії зіткнень Землі з космічними тілами існує потенційне упередження[12]. Астрономічні ризики існування життя так само можуть бути недооцінені з огляду на селективне упередження, і щодо них необхідно антропне коригування[13].

Подолання упередження[ред. | ред. код]

У загальному випадку, селективного упередження неможливо уникнути лише шляхом статистичного аналізу наявних даних, хоча деколи допоможе коригування Хекмана. Однак може бути здійснена неформальна оцінка ступеня селективного упередження шляхом оцінки кореляцій між зовнішніми (стосовно експерименту) змінами та індикатором покращення. Однак в регресійних моделях, упередження оцінює саме кореляцію між неспостереженими чинниками наслідків та неспостереженими чинниками відбору у вибірку, і ця кореляція між неспостереженими чинниками не може бути прямо оцінена спостережуваними чинниками.

Пов'язані питання[ред. | ред. код]

Селективне упередження тісно пов'язане з такими упередженнями, як:

  • упередження публікації або упередження звітування[en], викривленнями у сприйнятті громадськістю або метааналізі внаслідок того, що не публікуються/оприлюднюються або не звітується про нецікаві (звичайно негативні) результати, або ті результати, які суперечать попередній думці та упередженням дослідника, інтересам спонсора або очікуванням громадськості.
  • упередження підтвердження, викривлення, спричинене експериментами, які були розроблені таким чином, щоб отримати стверджувальні докази гіпотези, а не так, щоб намагатися її відкинути.
  • упередження виключення, яке є наслідком застосування різних критеріїв до випадків та контрольних точок, коли прийнятність участі у дослідженні або різні змінні слугують причиною для виключення.

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. Dictionary of Cancer Terms → selection bias [Архівовано 5 липня 2014 у Wayback Machine.]. Retrieved on September 23, 2009.
  2. Medical Dictionary — 'Sampling Bias' [Архівовано 10 березня 2016 у Wayback Machine.] Retrieved on September 23, 2009
  3. TheFreeDictionary → biased sample [Архівовано 17 червня 2019 у Wayback Machine.]. Retrieved on 2009-09-23. Site in turn cites: Mosby's Medical Dictionary, 8th edition.
  4. Dictionary of Cancer Terms → Selection Bias [Архівовано 9 червня 2009 у Wayback Machine.]. Retrieved on September 23, 2009.
  5. The effects of sample selection bias on racial differences in child abuse reporting [Архівовано 14 жовтня 2014 у Wayback Machine.] Ards S, Chung C, Myers SL Jr. Child Abuse Negl. 1999 Dec;23(12):1209; author reply 1211-5. PMID 9504213.
  6. Sample Selection Bias Correction Theory [Архівовано 27 вересня 2018 у Wayback Machine.] Corinna Cortes, Mehryar Mohri, Michael Riley, and Afshin Rostamizadeh. New York University.
  7. Domain Adaptation and Sample Bias Correction Theory and Algorithm for Regression [Архівовано 27 вересня 2018 у Wayback Machine.] Corinna Cortes, Mehryar Mohri. New York University.
  8. Page 262 in: Behavioral Science. Board Review Series. [Архівовано 17 липня 2014 у Wayback Machine.] By Barbara Fadem. ISBN 0-7817-8257-0, ISBN 978-0-7817-8257-9. 216 pages
  9. Kruskal, W. (1960) Some notes on wild observations, Technometrics. Архів оригіналу за 26 січня 2010. Процитовано 5 липня 2014. 
  10. а б DOI:10.1093/ije/dyh406
    Нема шаблону {{Cite doi/10.1093/ije/dyh406}}.заповнити вручну
  11. Bostrom, Nick (2002). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. ISBN 0-415-93858-9. 
  12. DOI:10.1111/j.1539-6924.2010.01460.x
    Нема шаблону {{Cite doi/10.1111/j.1539-6924.2010.01460.x}}.заповнити вручну
  13. DOI:10.1038/438754a
    Нема шаблону {{Cite doi/10.1038/438754a}}.заповнити вручну