Золотий стандарт діагностики
У медицині та медичній статистиці золотий стандарт, критеріальний стандарт[1] або референтний стандарт[2] — це діагностичний тест або орієнтир (бенчмарк), який є найкращим з доступних за розумних умов.[3] Це тест, з яким порівнюються нові тести для оцінки їхньої валідності, і він використовується для оцінки ефективності лікування.[1]
Значення терміну «золотий стандарт» в практичній медицині може відрізнятися від статистичного ідеалу. При деяких захворюваннях лише розтин може гарантувати діагностичну достовірність. У цих випадках «золотий стандарт» є найкращим тестом, який допомагає зберегти життя пацієнта, і навіть його використання може вимагати подальшого спостереження для підтвердження або спростування діагнозу.[4]
Термін «золотий стандарт» у його сучасному значенні в медичних дослідженнях був введений Раддом (Rudd) у 1979 році за аналогією монетарного золотого стандарту.[5]
«Золотий стандарт» може стосуватися клінічних кінцевих точок, за якими оцінюються наукові докази. Наприклад, у дослідженнях реанімації «золотим стандартом» для ліків або процедур є те, чи призводять вони до збільшення кількості неврологічно неушкоджених пацієнтів, які вижили і виписані з лікарні.[6] Інші види медичних досліджень можуть використовувати як «золотий стандарт» статистично значуще зниження 30-денної смертності.
У Посібнику Американської медичної асоціації (AMA) замість терміну «золотий стандарт» рекомендується використовувати термін «критерійний стандарт». Інші журнали також мають свої вимоги у своїх інструкціях для авторів.[7] Однак на практиці використання цього терміна авторами і редакційним колективом, є помітно низьким, принаймні для журналів Американської медичної асоціації.[8]
Коли критерієм є вся процедура клінічного тестування, його зазвичай називають «визначення клінічного випадку». Різні визначення випадків можуть призвести до суттєво відмінних результатів, якщо їх використовувати як основу для оцінки певного діагностичного методу.[9]
Гіпотетичний ідеальний тест «золотого стандарту» має 100 % чутливість щодо наявності захворювання (він ідентифікує всіх осіб із чітко визначеним процесом захворювання; не дає жодних хибнонегативних результатів) та 100 % специфічність (він не дає хибно виявити когось із захворюванням, у кого цього захворювання немає; не дає жодних хибнопозитивних результатів). На практиці таких тестів не існує.[10]
Іноді тест стає популярним і оголошується «золотим стандартом» без належного розгляду альтернатив або попри його слабкі сторони.[11]
З появою нових діагностичних методів «золотий стандарт» може змінюватися. Наприклад, для діагностики розшарування аорти «золотим стандартом» раніше була аортографія, чутливість якої становила лише 83 %, а специфічність — 87 %. З розвитком магнітно-резонансної томографії магнітно-резонансна ангіографія (МРА) стала новим «золотим стандартом» для діагностики розшарування аорти з чутливістю 95 % та специфічністю 92 %. До широкого визнання будь-якого нового тесту попередній тест зберігає свій статус «золотого стандарту».
Оскільки діагностичні тести можуть бути неточними (давати хибнонегативний або хибнопозитивний результат), результати слід інтерпретувати в контексті анамнезу, фізикальних даних та інших результатів тестування особи, яка його проходить. Саме в цьому контексті визначається чутливість та специфічність діагностичного тесту «золотого стандарту».
Коли «золотий стандарт» не є ідеальним, його чутливість та специфічність необхідно калібрувати за допомогою точніших тестів або за допомогою визначення стану іншим способом.[12] Таке калібрування особливо важливе, коли ідеальний тест доступний лише за результатами розтину. Тест повинен відповідати певній узгодженості між спостерігачами, щоб уникнути певної упередженості, спричиненої самим дослідженням.[13] Помилки калібрування можуть призвести до неправильного діагнозу.[14]
Іноді «золотий стандарт» стосується найкращого з доступних діагностичних тестів. У таких випадках іншого критерію, з яким його можна порівняти, немає. У цьому значенні тести «золотого стандарту» зазвичай взагалі не проводяться. Це пояснюється тим, що його може бути важко або неможливо виконати на живій людині (тобто діагностика проводиться в рамках розтину або може знадобитися занадто багато часу, щоб результати тесту були клінічно корисними).
В інших випадках «золотий стандарт» стосується не найкращого доступного тесту, а найкращого, доступного за розумних умов. Наприклад, МРТ є «золотим стандартом» діагностики пухлини головного мозку, хоча вона не така хороша, як біопсія. У цьому випадку чутливість і специфічність «золотого стандарту» не становлять 100 %, і його називають «недосконалим золотим стандартом» або «модифікованим золотим стандартом».[12]
- ↑ а б Borowitz D, Aronoff N, Cummings LC, Maqbool A, Mulberg AE (Квітень 2022). Coefficient of Fat Absorption to Measure the Efficacy of Pancreatic Enzyme Replacement Therapy in People With Cystic Fibrosis: Gold Standard or Coal Standard?. Pancreas. 51 (4): 310—318. doi:10.1097/MPA.0000000000002016. PMC 9257055. PMID 35695742.
- ↑ Gold, R; Reichman, M; Greenberg, E; Ivanidze, J; Elias, E; Tsiouris, AJ; Comunale, JP; Johnson, CE; Sanelli, PC (Вересень 2010). Developing a new reference standard: is validation necessary?. Academic Radiology. 17 (9): 1079—82. doi:10.1016/j.acra.2010.05.021. PMC 2919497. PMID 20692619.
- ↑ Versi E (Липень 1992). "Gold standard" is an appropriate term. BMJ. 305 (6846): 187. doi:10.1136/bmj.305.6846.187-b. PMC 1883235. PMID 1515860.
- ↑ Fardy, John M.; Barrett, Brendan J. (2015). Evaluation of Diagnostic Tests. Clinical Epidemiology (PDF). Methods in Molecular Biology. Т. 1281. с. 289—300. doi:10.1007/978-1-4939-2428-8_17. ISBN 978-1-4939-2427-1. PMID 25694317.
- ↑ Claassen, JA (24 грудня 2005). ['Gold standard', not 'golden standard']. Nederlands Tijdschrift voor Geneeskunde. 149 (52): 2937. PMID 16402524.
- ↑ ACLS: Principles and Practice. p. 62. Dallas: American Heart Association, 2003. ISBN 0-87493-341-2.
- ↑ Guide for Authors. Archives of biological Medicine and Rehabilitation. Elsevier.
- ↑ Criterion Standard - AMA Style Insider. 21 червня 2011. Процитовано 18 травня 2021.
- ↑ Bachmann, Lucas M; Jüni, Peter; Reichenbach, Stephan; Ziswiler, Hans-Rudolf; Kessels, Alfons G; Vögelin, Esther (1 серпня 2005). Consequences of different diagnostic 'gold standards' in test accuracy research: Carpal Tunnel Syndrome as an example. International Journal of Epidemiology. 34 (4): 953—955. doi:10.1093/ije/dyi105. PMID 15911545.
- ↑ Troy LM, Michels KB, Hunter DJ, Spiegelman D, Manson JE, Colditz GA та ін. (Лютий 1996). Self-reported birthweight and history of having been breastfed among younger women: an assessment of validity. International Journal of Epidemiology. 25 (1): 122—127. doi:10.1093/ije/25.1.122. PMID 8666479.
- ↑ Kaufman, Noah K. (3 липня 2022). Rethinking "gold standards" and "best practices" in the assessment of autism. Applied Neuropsychology: Child (англ.). 11 (3): 529—540. doi:10.1080/21622965.2020.1809414. ISSN 2162-2965. PMID 32847428.
- ↑ а б Spiegelman D, Schneeweiss S, McDermott A (Січень 1997). Measurement error correction for logistic regression models with an "alloyed gold standard". American Journal of Epidemiology. 145 (2): 184—196. doi:10.1093/oxfordjournals.aje.a009089. PMID 9006315.
- ↑ Stein PD, Athanasoulis C, Alavi A, Greenspan RH, Hales CA, Saltzman HA та ін. (Лютий 1992). Complications and validity of pulmonary angiography in acute pulmonary embolism. Circulation. 85 (2): 462—468. doi:10.1161/01.CIR.85.2.462. PMID 1735144.
- ↑ (Звіт). Washington (DC).
{{cite report}}: Пропущений або порожній|title=(довідка)