Хибно позитивні та хибно негативні: відмінності між версіями

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
[перевірена версія][перевірена версія]
Вилучено вміст Додано вміст
м Olexa Riznyk перейменував сторінку з Хибно позитивні та хибно негативні спрацювання на Хибно позитивні та хибно негативні: уточнено переклад
замінено актуальним доперекладом «False positives and false negatives»
Рядок 1: Рядок 1:
{{short description|Типи помилок у повідомленні даних}}
У медичній статистиці '''хибно позитивне та хибно негативне спрацювання''' — це поняття аналогічні до [[Похибки першого і другого роду|помилок першого та другого роду]] при перевірці статистичних гіпотез, де позитивний результат відповідає відхиленню нульової гіпотези, а негативний результат — відсутності достатніх підстав для того, щоб відхилити нульову гіпотезу. Термін часто вживається взаємнозамінно з поняттями помилок, але існують відмінності в деталях й інтерпретаціях.
'''Хи́бно позити́вне''' ({{lang-en|false positive}})&nbsp;— це помилка в [[Бінарна класифікація|бінарній класифікації]], в якій результат тесту неправильно вказує на наявність якогось стану, такого як захворювання, в той час як цього захворювання немає, тоді як '''хи́бно негати́вне''' ({{lang-en|false negative}})&nbsp;— це протилежна помилка, коли результатові тесту неправильно не вдається вказати на наявність якогось стану, коли він присутній. Це&nbsp;— два типи помилок у {{нп|Бінарний тест|бінарному тесті||Binary test}}, на противагу до двох типів правильного результату, {{якірець|істинно позитивне}}'''і́стинно позити́вного''' ({{lang-en|true positive}}) та {{якірець|істинно негативне}}'''і́стинно негати́вного''' ({{lang-en|true negative}}). Вони є також відомими в медицині як '''хи́бно позити́вний''' (та '''хи́бно негати́вний''') '''діа́гноз''', та в [[Статистична класифікація|статистичній класифікації]] як '''істиннопозити́вна''' (та '''істиннонегати́вна''') '''по́милка'''.<ref>[http://www.mathsisfun.com/data/probability-false-negatives-positives.html False Positives and False Negatives] {{ref-en}}</ref>


У [[Перевірка статистичних гіпотез|перевірці статистичних гіпотез]] аналогічні поняття є відомими як [[помилки першого та другого роду]], де позитивний результат відповідає відхиленню [[Нульова гіпотеза|нульової гіпотези]], а негативний результат відповідає не відхиленню нульової гіпотези. Ці терміни часто використовують як взаємозамінні, але існують відмінності в деталях та інтерпретації, через відмінності між медичним тестуванням та перевіркою статистичних гіпотез.
== Хибно позитивна помилка ==
'''Хибно позитивна помилка''', часто називають «'''помилковим спрацюванням'''» або «'''помилковою тривогою'''», це результат, що вказує на існування певної умови, коли це не так. Наприклад, у випадку байки Езопа «Хлопчик, що кричав «вовк», умовою, що перевірялась, була «чи є вовк біля стада?»; пастух, спочатку, помилково визначив, крикнувши: «Вовк, вовк!»


== Хибнопозитивна помилка ==
Хибно позитивні помилки&nbsp;— помилки першого роду, тобто тест перевіряється на одну умову та помилково дає позитивний результат (не відкидається нульова гіпотеза). Однак, важливо відрізняти поняття відсотка похибок першого роду від імовірності того, що позитивний результат є помилковим.


'''Хибнопозити́вна по́милка''' ({{lang-en|false positive error}}), або '''хи́бно позити́вне''' ({{lang-en|false positive}})&nbsp;— це результат, який вказує на наявність заданого стану, тоді як його немає. Наприклад, тест на вагітність, який вказує, що жінка є вагітною, тоді як вона такою не є, або засудження невинної особи.
== Хибно негативна помилка ==
'''Хибно негативна помилка'''&nbsp;— результат тесту, котрий полягає в тому, що умова не виконується, у той час як, насправді, це не так (тобто помилково, ніяких аномалій відхилення від норми не виявлено). Прикладом є, насправді винний, але виправданий злочинець. Умова «в'язень винний». Але тест (розгляд розслідування судом) помилково вирішив, що ув'язнений не винний, хибно зробивши негативний висновок щодо умови, яка перевірялася.


Хибнопозитивна помилка є [[Помилка першого роду|помилкою першого роду]], в якій тест перевіряє єдину умову, й неправильно видає ствердне (позитивне) рішення. Проте важливо відрізняти рівень помилок першого роду ({{lang-en|type 1 error rate}}), та ймовірність хибності позитивного результату. Остання є відомою як хибнопозитивний ризик ({{lang-en|false positive risk}}, див. [[#Неоднозначність у визначенні хибнопозитивного рівня|неоднозначність у визначенні хибнопозитивного рівня]] нижче).<ref name="DC2017"/>
Хибно негативна помилка&nbsp;— помилка другого роду, що виникає під час перевірки однієї гіпотези, коли результат тесту помилково вказує на те, що дана гіпотеза неправильна.<ref name="fn">{{cite journal|title=Hypothesis testing, type I and type II errors|date=2009|pmc=2996198|pmid=21180491|doi=10.4103/0972-6748.62274|volume=18|journal=Ind Psychiatry J|pages=127–31|last1=Banerjee|first1=A|last2=Chitnis|first2=UB|last3=Jadhav|first3=SL|last4=Bhawalkar|first4=JS|last5=Chaudhury|first5=S}}</ref>


== Хибнонегативна помилка ==
== Посилання ==

'''Хибнонегати́вна по́милка''' ({{lang-en|false negative error}}), або '''хи́бно негати́вне''' ({{lang-en|false negative}})&nbsp;— це результат тесту, який неправильно вказує, що умова не виконується. Наприклад, коли тест на вагітність вказує, що жінка не є вагітною, але вона є, або коли особу, винну в злочині, виправдано, то ці результати є хибно негативними. Умови «жінка є вагітною» та «особа є винною» виконуються, але тестові (тестові на вагітність, або судовому розглядові) не вдається усвідомити цю умову, й вони помилково вирішують, що особа є не вагітною, або не винною.

Хибнонегативна помилка є [[Помилка другого роду|помилкою другого роду]], яка трапляється в тесті, в якому перевіряють наявність єдиної умови, й результат тесту є помилковим, що ця умова відсутня.<ref name="fn">{{cite journal | title=Hypothesis testing, type I and type II errors | date=2009 | pmc=2996198 | pmid=21180491 | doi=10.4103/0972-6748.62274 | volume=18 | issue=2 | journal=Ind Psychiatry J | pages=127–31 | last1 = Banerjee | first1 = A | last2 = Chitnis | first2 = UB | last3 = Jadhav | first3 = SL | last4 = Bhawalkar | first4 = JS | last5 = Chaudhury | first5 = S}} {{ref-en}}</ref>

== Пов'язані терміни ==

=== Хибнопозитивний та хибнонегативний рівні ===
{{Докладніше1|[[Чутливість та специфічність]] та {{нп|Хибнопозитивний рівень|||False positive rate}}}}

{{нп|Хибнопозитивний рівень|||False positive rate}} ({{lang-en|false positive rate}})&nbsp;— це частка з усіх негативних, які все ж видають позитивні результати тесту, тобто, умовна ймовірність позитивного результату тесту за умови відсутності події.

Хибнопозитивний рівень дорівнює [[Рівень значущості|рівневі значущості]]. [[Специфічність тесту]] дорівнює '''1''' мінус хибнопозитивний рівень.

У [[Перевірка статистичних гіпотез|перевірці статистичних гіпотез]] цю частку позначують грецькою літерою ''α'', а 1&nbsp;&minus;&nbsp;''α'' визначають як специфічність тесту. Збільшення специфічності тесту знижує ймовірність помилок першого роду, але може підвищити ймовірність помилок другого роду (хибно негативних, які відхиляють альтернативну гіпотезу, коли вона є істинною).{{efn|При розробці алгоритмів виявляння або тестів необхідно обирати баланс між ризиками хибно негативних та хибно позитивних. Зазвичай існує поріг того, наскільки близького збігу з заданим зразком мусить бути досягнуто, щоби алгоритм повідомив про збіг. Що вищим є цей поріг, то більше хибно негативних, і менше хибно позитивних.}}

{{якірець|Хибнонегативний рівень}}Відповідно, '''хибнонегати́вний рі́вень''' ({{lang-en|false negative rate}})&nbsp;— це частка із позитивних, які дають негативний результат за цього тесту, тобто, умовна ймовірність негативного результату тесту за умови наявності шуканої умови.

У [[Перевірка статистичних гіпотез|перевірці статистичних гіпотез]] цю частку позначують грецькою літерою ''β''. «[[Статистична потужність|Потужність]]» ({{lang-en|«power»}}, або «[[Чутливість тесту|чутливість]]», {{lang-en|«sensitivity»}}) тесту дорівнює 1&nbsp;&minus;&nbsp;''β''.

=== Неоднозначність у визначенні хибнопозитивного рівня ===

Термін «рівень хибного виявляння» (РХВ, {{lang-en|false discovery rate, FDR}}) використовував Колкагун (2014)<ref name=DC2014>{{cite journal |last1=Colquhoun| first1=David| title=An investigation of the false discovery rate and the misinterpretation of ''p''-values| journal=Royal Society Open Science |date=2014|volume=1| issue=3|page=140216|doi=10.1098/rsos.140216| pmid=26064558| pmc=4448847}} {{ref-en}}</ref> для позначення ймовірності того, що «значущий» результат був хибно позитивним. Пізніше Колкагун (2017)<ref name="DC2017">{{cite journal|last1=Colquhoun|first1=David|title=The reproducibility of research and the misinterpretation of p-values|journal=Royal Society Open Science|volume=4|issue=12|pages=171085|date=2017|doi=10.1098/rsos.171085|pmid=29308247|pmc=5750014}} {{ref-en}}</ref> використовував для тієї ж величини термін «хибнопозитивний ризик» ({{lang-en|false positive risk, FPR}}), щоби запобігти плутанині з терміном РХВ, що використовують люди, які працюють з декількома порівняннями. Коригування для декількох порівнянь мають на меті коригування лише рівня помилок першого роду, тож результат є (скоригованим) [[p-значення|''p''-значенням]]. Таким чином, вони є вразливими для такого ж неправильного тлумачення, як і будь-яке інше ''p''-значення. Хибнопозитивний ризик є завжди вищим, часто набагато вищим за ''p''-значення.<ref name="DC2014"/><ref name="DC2017"/>

Переплутування цих двох ідей, {{нп|Хиба транспонованого обумовлення|помилка транспонованого обумовлення||Fallacy of transposed conditional}}, наробила багато лиха.<ref name="DC2016">{{cite web|last1=Colquhoun |first1=David |title= The problem with p-values |url= https://aeon.co/essays/it-s-time-for-science-to-abandon-the-term-statistically-significant |website= Aeon|publisher= Aeon Magazine|accessdate =11 December 2016}} {{ref-en}}</ref> Через неоднозначність позначень у цій галузі важливо дивитися на визначення в кожній праці. Небезпеки покладання на ''p''-значення підкреслив Колкагун (2017),<ref name="DC2017"/> вказавши, що навіть спостереження ''p'' = 0,001 не обов'язково було сильним свідченням проти нульової гіпотези. Незважаючи на те, що відношення правдоподібностей на користь альтернативної гіпотези над нульовою є близьким до 100, якщо ця гіпотеза була неправдоподібною, з [[Апріорна ймовірність|апріорною ймовірністю]] реального ефекту 0,1, то навіть спостереження ''p'' = 0,001 матиме хибнопозитивний рівень 8 відсотків. Він не досягне навіть 5-відсоткового рівня. Як наслідок, було рекомендовано<ref name="DC2017"/><ref name="DC2018">{{cite journal|arxiv=1802.04888|last1=Colquhoun|first1=David|title=The false positive risk: A proposal concerning what to do about p values|journal=The American Statistician|volume=73|pages=192–201|year=2018|doi=10.1080/00031305.2018.1529622}} {{ref-en}}</ref> супроводжувати кожне ''p''-значення апріорною ймовірністю існування реального ефекту, яку необхідно було би прийняти для досягнення хибнопозитивного ризику 5&nbsp;%. Наприклад, якщо ми спостерігаємо ''p'' = 0,05 в єдиному експерименті, то щоби досягти хибнопозитивного ризику 5&nbsp;%, до здійснення цього експерименту ми повинні бути впевненими в існуванні реального ефекту на 87&nbsp;%.

=== Робоча характеристика приймача ===

Стаття «[[Робоча характеристика приймача]]» розглядає параметри в статистичній обробці сигналів, що ґрунтуються на співвідношеннях похибок різних типів.

== Виноски ==
{{notelist}}

== Примітки ==
{{reflist}}
{{reflist}}


== Див. також ==
== Додаткові посилання ==
* {{нп|Хлопчик, який кричав «вовк»|||The boy who cried wolf}}
* [https://www.economist.com/blogs/graphicdetail/2013/10/daily-chart-2 Daily chart&nbsp;— Unlikely results&nbsp;— Why most published scientific research is probably false]&nbsp;— Illustration of False positives and false negatives in [[Економіст (журнал)|The Economist]] appearing in the article [https://www.economist.com/news/leaders/21588069-scientific-research-has-changed-world-now-it-needs-change-itself-how-science-goes-wrong#sthash.mNf8cPBk.dpbs Problems with scientific research How science goes wrong Scientific research has changed the world.] [https://www.economist.com/news/leaders/21588069-scientific-research-has-changed-world-now-it-needs-change-itself-how-science-goes-wrong#sthash.mNf8cPBk.dpbs Now it needs to change itself] (19 October 2013)


== Посилання ==
{{Перекласти|en|False positives and false negatives}}
* [https://www.economist.com/blogs/graphicdetail/2013/10/daily-chart-2 Daily chart&nbsp;— Unlikely results&nbsp;— Why most published scientific research is probably false]&nbsp;— ілюстрація хибно позитивних та хибно негативних у журналі «[[Економіст (журнал)|Економіст]]» зі статті [https://www.economist.com/news/leaders/21588069-scientific-research-has-changed-world-now-it-needs-change-itself-how-science-goes-wrong#sthash.mNf8cPBk.dpbs Problems with scientific research How science goes wrong Scientific research has changed the world. Now it needs to change itself] (19 жовтня 2013) {{ref-en}}


[[Категорія:Помилки]]
[[Категорія:Помилки]]

Версія за 20:01, 24 грудня 2020

Хи́бно позити́вне (англ. false positive) — це помилка в бінарній класифікації, в якій результат тесту неправильно вказує на наявність якогось стану, такого як захворювання, в той час як цього захворювання немає, тоді як хи́бно негати́вне (англ. false negative) — це протилежна помилка, коли результатові тесту неправильно не вдається вказати на наявність якогось стану, коли він присутній. Це — два типи помилок у бінарному тесті, на противагу до двох типів правильного результату, і́стинно позити́вного (англ. true positive) та і́стинно негати́вного (англ. true negative). Вони є також відомими в медицині як хи́бно позити́вний (та хи́бно негати́вний) діа́гноз, та в статистичній класифікації як істиннопозити́вна (та істиннонегати́вна) по́милка.[1]

У перевірці статистичних гіпотез аналогічні поняття є відомими як помилки першого та другого роду, де позитивний результат відповідає відхиленню нульової гіпотези, а негативний результат відповідає не відхиленню нульової гіпотези. Ці терміни часто використовують як взаємозамінні, але існують відмінності в деталях та інтерпретації, через відмінності між медичним тестуванням та перевіркою статистичних гіпотез.

Хибнопозитивна помилка

Хибнопозити́вна по́милка (англ. false positive error), або хи́бно позити́вне (англ. false positive) — це результат, який вказує на наявність заданого стану, тоді як його немає. Наприклад, тест на вагітність, який вказує, що жінка є вагітною, тоді як вона такою не є, або засудження невинної особи.

Хибнопозитивна помилка є помилкою першого роду, в якій тест перевіряє єдину умову, й неправильно видає ствердне (позитивне) рішення. Проте важливо відрізняти рівень помилок першого роду (англ. type 1 error rate), та ймовірність хибності позитивного результату. Остання є відомою як хибнопозитивний ризик (англ. false positive risk, див. неоднозначність у визначенні хибнопозитивного рівня нижче).[2]

Хибнонегативна помилка

Хибнонегати́вна по́милка (англ. false negative error), або хи́бно негати́вне (англ. false negative) — це результат тесту, який неправильно вказує, що умова не виконується. Наприклад, коли тест на вагітність вказує, що жінка не є вагітною, але вона є, або коли особу, винну в злочині, виправдано, то ці результати є хибно негативними. Умови «жінка є вагітною» та «особа є винною» виконуються, але тестові (тестові на вагітність, або судовому розглядові) не вдається усвідомити цю умову, й вони помилково вирішують, що особа є не вагітною, або не винною.

Хибнонегативна помилка є помилкою другого роду, яка трапляється в тесті, в якому перевіряють наявність єдиної умови, й результат тесту є помилковим, що ця умова відсутня.[3]

Пов'язані терміни

Хибнопозитивний та хибнонегативний рівні

Детальніші відомості з цієї теми ви можете знайти в статті Чутливість та специфічність та Хибнопозитивний рівень.

Хибнопозитивний рівень (англ. false positive rate) — це частка з усіх негативних, які все ж видають позитивні результати тесту, тобто, умовна ймовірність позитивного результату тесту за умови відсутності події.

Хибнопозитивний рівень дорівнює рівневі значущості. Специфічність тесту дорівнює 1 мінус хибнопозитивний рівень.

У перевірці статистичних гіпотез цю частку позначують грецькою літерою α, а 1 − α визначають як специфічність тесту. Збільшення специфічності тесту знижує ймовірність помилок першого роду, але може підвищити ймовірність помилок другого роду (хибно негативних, які відхиляють альтернативну гіпотезу, коли вона є істинною).[a]

Відповідно, хибнонегати́вний рі́вень (англ. false negative rate) — це частка із позитивних, які дають негативний результат за цього тесту, тобто, умовна ймовірність негативного результату тесту за умови наявності шуканої умови.

У перевірці статистичних гіпотез цю частку позначують грецькою літерою β. «Потужність» (англ. «power», або «чутливість», англ. «sensitivity») тесту дорівнює 1 − β.

Неоднозначність у визначенні хибнопозитивного рівня

Термін «рівень хибного виявляння» (РХВ, англ. false discovery rate, FDR) використовував Колкагун (2014)[4] для позначення ймовірності того, що «значущий» результат був хибно позитивним. Пізніше Колкагун (2017)[2] використовував для тієї ж величини термін «хибнопозитивний ризик» (англ. false positive risk, FPR), щоби запобігти плутанині з терміном РХВ, що використовують люди, які працюють з декількома порівняннями. Коригування для декількох порівнянь мають на меті коригування лише рівня помилок першого роду, тож результат є (скоригованим) p-значенням. Таким чином, вони є вразливими для такого ж неправильного тлумачення, як і будь-яке інше p-значення. Хибнопозитивний ризик є завжди вищим, часто набагато вищим за p-значення.[4][2]

Переплутування цих двох ідей, помилка транспонованого обумовлення, наробила багато лиха.[5] Через неоднозначність позначень у цій галузі важливо дивитися на визначення в кожній праці. Небезпеки покладання на p-значення підкреслив Колкагун (2017),[2] вказавши, що навіть спостереження p = 0,001 не обов'язково було сильним свідченням проти нульової гіпотези. Незважаючи на те, що відношення правдоподібностей на користь альтернативної гіпотези над нульовою є близьким до 100, якщо ця гіпотеза була неправдоподібною, з апріорною ймовірністю реального ефекту 0,1, то навіть спостереження p = 0,001 матиме хибнопозитивний рівень 8 відсотків. Він не досягне навіть 5-відсоткового рівня. Як наслідок, було рекомендовано[2][6] супроводжувати кожне p-значення апріорною ймовірністю існування реального ефекту, яку необхідно було би прийняти для досягнення хибнопозитивного ризику 5 %. Наприклад, якщо ми спостерігаємо p = 0,05 в єдиному експерименті, то щоби досягти хибнопозитивного ризику 5 %, до здійснення цього експерименту ми повинні бути впевненими в існуванні реального ефекту на 87 %.

Робоча характеристика приймача

Стаття «Робоча характеристика приймача» розглядає параметри в статистичній обробці сигналів, що ґрунтуються на співвідношеннях похибок різних типів.

Виноски

  1. При розробці алгоритмів виявляння або тестів необхідно обирати баланс між ризиками хибно негативних та хибно позитивних. Зазвичай існує поріг того, наскільки близького збігу з заданим зразком мусить бути досягнуто, щоби алгоритм повідомив про збіг. Що вищим є цей поріг, то більше хибно негативних, і менше хибно позитивних.

Примітки

  1. False Positives and False Negatives (англ.)
  2. а б в г д Colquhoun, David (2017). The reproducibility of research and the misinterpretation of p-values. Royal Society Open Science. 4 (12): 171085. doi:10.1098/rsos.171085. PMC 5750014. PMID 29308247. (англ.)
  3. Banerjee, A; Chitnis, UB; Jadhav, SL; Bhawalkar, JS; Chaudhury, S (2009). Hypothesis testing, type I and type II errors. Ind Psychiatry J. 18 (2): 127—31. doi:10.4103/0972-6748.62274. PMC 2996198. PMID 21180491.{{cite journal}}: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) (англ.)
  4. а б Colquhoun, David (2014). An investigation of the false discovery rate and the misinterpretation of p-values. Royal Society Open Science. 1 (3): 140216. doi:10.1098/rsos.140216. PMC 4448847. PMID 26064558. (англ.)
  5. Colquhoun, David. The problem with p-values. Aeon. Aeon Magazine. Процитовано 11 December 2016. (англ.)
  6. Colquhoun, David (2018). The false positive risk: A proposal concerning what to do about p values. The American Statistician. 73: 192—201. arXiv:1802.04888. doi:10.1080/00031305.2018.1529622. (англ.)

Див. також

Посилання