Тест Тюрінга

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
Стандартна інтерпретація тесту Тюрінга

Тест Тюрінга — емпіричний тест, ідея якого була запропонована Аланом Тюрингом в статті «Обчислювальні машини та розум», опублікованій в 1950 році в філософському журналі Mind. Тьюринг поставив собі за мету визначити, чи може машина мислити як людина.

Стандартна інтерпретація цього тесту звучить наступним чином: «Суддя взаємодіє з одним комп'ютером і однією людиною. На підставі відповідей на питання суддя повинен визначити, з ким він розмовляє: з людиною або з комп'ютерною програмою. Завдання комп'ютерної програми - ввести суддю в оману, змусивши зробити невірний вибір».

Всі учасники тесту не бачать один одного. Якщо суддя не може сказати точно, хто з співрозмовників є людиною, то вважається, що машина пройшла тест. Щоб протестувати саме інтелект машини, а не її можливість розпізнавати усне мовлення, бесіда ведеться в режимі «тільки текст», наприклад, за допомогою клавіатури і екрану (комп'ютера-посередника). Листування повинно проводитися через контрольовані проміжки часу, щоб суддя не міг робити висновки, виходячи з швидкості відповідей. За часів Тьюринга комп'ютери реагували повільніше людини. Зараз це правило теж необхідно, тому що вони реагують набагато швидше, ніж людина.

Історія[ред.ред. код]

Філософські передумови[ред.ред. код]

Хоча дослідження в області штучного інтелекту почалися в 1956 році, їх філософське коріння сягає глибоко в минуле. Питання, чи зможе машина думати, має довгу історію. Воно тісно пов'язане з відмінностями між дуалістичним і матеріалістичними поглядами. З точки зору дуалізму, думка не є матеріальною (або, що найменше, не має матеріальних властивостей), і тому розум не можна пояснити тільки за допомогою фізичних понять. З іншого боку, матеріалізм говорить, що розум можна пояснити фізично, таким чином, залишаючи можливість існування умів, створених штучно.

В 1936 у філософ Альфред Айер розглянув звичайне для філософії питання щодо інших умів: як дізнатися, що інші люди мають той же свідомий досвід, що і ми? У своїй книзі «Мова, істина і логіка» Айер запропонував алгоритм розпізнавання усвідомлюючої людини і не усвідомлюючої машини: «Єдиною підставою, чому я можу стверджувати, що об'єкт, який здається розумним, насправді не розумна істота, а просто дурна машина, є те, що він не може пройти один з емпіричних тестів, згідно з якими визначається наявність або відсутність свідомості». Це висловлювання дуже схоже на тест Тюринга, проте точно не відомо, чи була відома Тюрингу популярна філософська класика Айера.

Незважаючи на те, що пройшло понад 50 років, тест Тюринга не втратив своєї значимості. Але в даний час дослідники штучного інтелекту практично не займаються вирішенням завдання проходження тесту Тюринга, вважаючи, що набагато важливіше вивчити основоположні принципи інтелекту, ніж продублювати одного з носіїв природного інтелекту. Зокрема, проблему «штучного польоту» вдалося успішно вирішити лише після того, як брати Райт та інші дослідники перестали імітувати птахів і приступили до вивчення аеродинаміки. У наукових і технічних роботах з повітроплавання мета цієї галузі знань не визначається як «створення машин, які в своєму польоті настільки нагадують голубів, що навіть можуть обдурити справжніх птахів». [1]

Алан Тюринг[ред.ред. код]

До 1956 року британські вчені вже протягом 10 років досліджували «машинний інтелект». Це питання було звичайним предметом для обговорення серед членів «Ratio Club» - неформальної групи британських кібернетиків і дослідників в галузі електроніки, в якій перебував і Алан Тюринг, в честь якого був названий тест.

Тюринг особливо займався проблемою машинного інтелекту, щонайменше, з 1941 року. Одне з найперших його згадок про «комп'ютерний інтелект» було зроблено в 1947 році. У доповіді «Інтелектуальні машини» Тюринг досліджував питання, чи може машина виявляти розумну поведінку, і в рамках цього дослідження запропонував те, що може вважатися предтечею його подальших досліджень: «Неважко розробити машину, яка буде непогано грати в шахи. Тепер візьмемо трьох осіб - суб'єктів експерименту. А, В і С. Нехай А і С погано грають в шахи, а В - оператор машини. [...] Використовуються дві кімнати, а також деякий механізм для передачі повідомлень про ходи. Учасник С грає або з А, або з машиною. Учасник С може затруднитися відповісти, з ким він грає ».

Таким чином, до моменту публікації в 1950 році статті «Обчислювальні машини й розум», Тюринг вже протягом багатьох років розглядав можливість існування штучного інтелекту. Проте дана стаття стала першою статтею Тюринга, в якій розглядалося виключно це поняття.

Тьюринг починає свою статтю твердженням: «Я пропоную розглянути питання" Чи можуть машини думати?"». Він підкреслює, що традиційний підхід до цього питання полягає в тому, щоб спочатку визначити поняття «машина» і «інтелект». Тюринг, однак, вибрав інший шлях; замість цього він замінив вихідне питання іншим, «яке тісно пов'язане з вихідним питанням і формулюється недвозначно». По суті, він пропонує замінити питання «Чи думають машини?» -питанням «Чи можуть машини робити те, що можемо робити ми (як мислячі створіння)?». Перевагою нового питання, як стверджує Тюринг, є те, що він проводить «чітку межу між фізичними та інтелектуальними можливостями людини».

Щоб продемонструвати цей підхід, Тьюринг пропонує тест, придуманий за аналогією з грою для вечірок «Imitation game» - імітаційна гра. У цій грі чоловік і жінка направляються в різні кімнати, а гості намагаються розрізнити їх, задаючи їм серію письмових запитань і читаючи надруковані на машинці відповіді на них. За правилами гри і чоловік, і жінка намагаються переконати гостей, що все навпаки. Тьюринг пропонує переробити гру наступним чином: "Тепер запитаймо себе, що трапиться, якщо в цій грі роль А виконуватиме машина? Чи буде питаючий помилятися так само часто, як якщо б він грав з чоловіком і жінкою? Ці питання замінюють собою вихідне «Чи може машина думати?».

У тій же доповіді Тюринг пізніше пропонує «еквівалентну» альтернативну формулювання, що включає суддю, який розмовляє тільки з комп'ютером і людиною. Поряд з тим, що жодне з цих формулювань точно не відповідає тій версії тесту Тюринга, яка найбільш відома сьогодні, в 1952 вчений запропонував третю. У цій версії тесту, яку Тюринг обговорив в ефірі радіо Бі-Бі-Сі, журі задає питання комп'ютеру, а роль комп'ютера полягає в тому, щоб змусити значну частину членів журі повірити, що він насправді людина.

У статті Тюринга враховані 9 передбачуваних питань, які включають всі основні заперечення проти штучного інтелекту, підняті після того, як стаття була вперше опублікована.

Еліза і PARRY[ред.ред. код]

Блей Вітбі вказує на чотири основні поворотні точки в історії тесту Тюринга - публікація статті «Обчислювальні машини й розум» в 1950, повідомлення про створення Джозефом Уайзенбаумом програми Еліза (ELIZA) в 1966, створення Кеннетом Колбі програми PARRY, яка була вперше описана в 1972 році, і Колоквіум Тюринга в 1990.

Принцип роботи Елізи полягає в дослідженні введених користувачем коментарів на наявність ключових слів. Якщо знайдено ключове слово, то застосовується правило, за яким коментар користувача перетворюється і повертається результат. Якщо ж ключове слово не знайдене, Еліза або повертає користувачеві загальну відповідь, або повторює один з попередніх коментарів. До того ж Уайзенбаум запрограмував Елізу на імітацію поведінки психотерапевта, що працює за клієнт-центрованою методикою. Це дозволяє Елізі «прикинутися, що вона не знає майже нічого про реальний світ». Застосовуючи ці способи, програма Уайзенбаума могла вводити в оману деяких людей, які думали, що вони розмовляють з реально існуючою людиною, а деяких було «дуже важко переконати, що Еліза [...] не людина». На цій підставі деякі стверджують, що Еліза - одна з програм (можливо перша), які змогли пройти тест Тюринга. Однак це твердження дуже спірне, тому що людей, «які задають питання», інструктували так, щоб вони думали, що з ними буде розмовляти справжній психотерапевт, і не підозрювали про те, що вони можуть розмовляти з комп'ютером.

Робота Колбі - PARRY - була описана, як «Еліза з думками»: програма намагалася моделювати поведінку параноїдального шизофреніка, використовуючи схожий (а то й більш просунутий) з Елізою підхід, застосований Уайзенбаумом. Для того щоб перевірити програму, PARRY тестували на початку 70-х, використовуючи модифікацію тесту Тюринга. Команда досвідчених психіатрів аналізувала групу, складену з реальних пацієнтів і комп'ютерів під управлінням PARRY, використовуючи телетайп. Інший команді з 33 психіатрів пізніше показали стенограми розмов. Потім обидві команди попросили визначити, хто з «пацієнтів» - людина, а хто - комп'ютерна програма. Психіатри лише в 48% випадків змогли винести правильне рішення. Ця цифра узгоджується з ймовірністю випадкового вибору. Ці експерименти не були тестами Тюринга в повному сенсі, так як для винесення рішення даний тест вимагає, щоб питання можна було ставити в інтерактивному режимі, замість читання стенограми бесіди, що вже пройшла.

Майже всі розроблені програми і близько не підійшли до проходження тесту. Хоча такі програми, як Еліза ( ELIZA), іноді змушували людей вірити, що вони говорять з людиною, як, наприклад, в неформальному експерименті, названому AOLiza, але ці випадки не можна вважати коректним проходженням тесту Тюрінга за цілою низкою причин:

  • Людина в таких бесідах не мала ніяких підстав вважати, що вона говорить з програмою, в той час як у справжньому тесті Тюринга людина активно намагається визначити, з ким вона розмовляє.
  • Задокументовані випадки зазвичай ставляться до таких чатів, як IRC, де багато бесід уривчасті і безглузді.
  • Багато користувачів Інтернету використовують англійську мову як другу або третю мову, так що безглузді відповіді програми легко можуть бути списані на мовний бар'єр.
  • Багато просто нічого не знають про Елізу і їй подібні програми, і тому не визнають співрозмовника програмою навіть в разі абсолютно нелюдських помилок, які ці програми допускають.

Китайська кімната[ред.ред. код]

Докладніше: Китайська кімната

У 1980 році в статті «Розум, мозок і програми» Джон Серль висунув аргумент проти тесту Тюринга, відомий як уявний експеримент «Китайська кімната». Серль наполягав, що програми (такі як Еліза) змогли пройти тест Тюринга, просто маніпулюючи символами, значення яких вони не розуміли. А без розуміння їх не можна вважати «розумними» в тому ж сенсі, що і людей. «Таким чином, - робить висновок Серль, - тест Тюринга не є доказом того, що машина може думати, а це суперечить споконвічному припущенню Тьюринга».

Такі аргументи, як запропонований Сёрлем, а також інші, засновані на філософії розуму, породили набагато більш бурхливі дискусії про природу розуму, можливості існування розумних машин і значущості тесту Тюринга, що тривали протягом 80-х і 90-х років.

Колоквіум Тьюринга[ред.ред. код]

У 1990 році відбулася сорокова річниця публікації статті Тюринга «Обчислювальні машини й розум», що відновило інтерес до тесту. У цьому році відбулися дві важливі події.

Одна з них - колоквіум Тюринга, який проходив в квітні в Університеті Сассекса. В його рамках зустрілися академіки і дослідники з різноманітних галузей науки, щоб обговорити тест Тюринга з позицій його минулого, сьогодення і майбутнього. Другою подією стало заснування щорічного змагання на здобуття премії Лёбнера.


7 червня 2014 року, на конкурсі, присвяченому 60-річчю з дня смерті Тюрінга, комп'ютерна програма Євген Густман, що видавала себе за 13-річного хлопчика з України, переконала 33% суддів, що вона людина, ставши першим в історії комп'ютером, але багато скептиків не вважають, що тест був пройдений.[2] [3]

Премія Лёбнера[ред.ред. код]

Щорічний конкурс «AI Loebner» на здобуття премії Лёбнера є платформою для практичного проведення тестів Тьюринга. Перший конкурс пройшов, колу був 1991 рік. Приз гарантований Х'ю Лёбнером (Hugh Loebner). Кембриджський центр досліджень поведінки, розташований в Массачусетсі (США), надавав призи до 2003 року включно. За словами Лёбнера, змагання було організовано з метою просування вперед в області досліджень, пов'язаних зі штучним інтелектом, частково тому, що «ніхто не зробив заходів, щоб це здійснити».

Срібна (текстова) і золота (аудіо і зорова) медалі ніколи ще не вручалися. Проте щорічно з усіх представлених на конкурс комп'ютерних систем судді нагороджують бронзовою медаллю ту, яка, на їхню думку, продемонструє «найбільш людську» поведінку в розмові. Не так давно програма «Штучне лінгвістичне інтернет-комп'ютерна істота» (Artificial Linguistic Internet Computer Entity - A.L.I.C.E.) тричі завоювала бронзову медаль (у 2000, 2001 і 2004). Здатна до навчання програма Jabberwacky [4] перемагала в 2005 і 2006. Її творці запропонували персоналізовану версію: можливість пройти імітаційний тест, намагаючись більш точно зімітувати людину, з якою машина тісно поспілкувалася перед тестом.

Конкурс перевіряє здатність розмовляти; переможцями стають зазвичай чат-боти або « Штучні розмовні істоти» (Artificial Conversational Entities (ACE) s). Правилами перших конкурсів передбачалося обмеження. Згідно з цим обмеженням кожна бесіда з програмою або прихованим людиною могла бути тільки на одну тему. Починаючи з конкурсу 1995 року, це правило скасовано. Тривалість розмови між суддею і учасником була різною в різні роки. У 2003 році, коли конкурс проходив в Університеті Суррея, кожен суддя міг розмовляти з кожним учасником (машиною або людиною) рівно 5 хвилин. З 2004 по 2007 цей час становив вже понад 20 хвилин. У 2008 максимальний час розмови становило 5 хвилин на пару, тому що організатор Кевін Ворвік (Kevin Warwick) і координатор Хьюмен Ша (Huma Shah) вважали, що ACE не мали технічних можливостей підтримувати більш тривалу бесіду. Переможець 2008 року, Elbot [5], не прикидався людиною, але все-таки зумів обдурити трьох суддів. У конкурсі, проведеному в 2010 році, було збільшено час до 25 хвилин при спілкуванні між системою і дослідником, на вимогу спонсора (програми просунулися вперед в здатності імітувати людини, і тільки лише при тривалій бесіді з'являються нюанси, що дозволяють обчислювати співрозмовника). Конкурс, проведений 15 травня 2012 року, відбувся вперше в світі з прямою трансляцією бесіди, що тільки піднімає інтерес до даного конкурсу.

Поява конкурсу на здобуття премії Лёбнера призвела до відновлення дискусій про доцільність тесту Тьюринга, про значення його проходження. У статті «Штучна тупість» газети The Economist відзначається, що перша програма-переможець конкурсу змогла виграти частково тому, що вона «імітувала людські помилки». (Тьюринг запропонував, щоб програми додавали помилки в висновок, щоб бути кращими «гравцями»). Існувала думка, що спроби пройти тест Тьюринга просто перешкоджають більш плідним дослідженням.

Під час перших конкурсів була виявлена друга проблема: участь недостатньо компетентних суддів, які піддавалися вміло організованим маніпуляціям, а не тому, що можна вважати інтелектом.

Проте з 2004 року як співрозмовники в конкурсі беруть участь філософи, комп'ютерні фахівці та журналісти.

Варто зауважити, що повного діалогу з машиною поки не існує. А то, що є, більше нагадує спілкування в колі друзів, коли відповідаєш на запитання одного, а слідом задає питання інший або як би на твоє запитання відповідав хтось зовсім сторонній. На цьому і можна ловити машинну програму, якщо перевіряти її по тесту Тьюринга.

Суддівство на конкурсі дуже суворе. Експерти заздалегідь готуються до турніру і підбирають досить хитромудрі питання, щоб зрозуміти, з ким же вони спілкуються. Їх розмова з програмами нагадує допит слідчого. Судді люблять, наприклад, повторювати деякі питання через певний час, так як слабкі боти не вміють стежити за історією діалогу і їх можна зловити на одноманітних відповідях [6].

Колоквіум по розмовним системам, 2005[ред.ред. код]

У листопаді 2005 року в Університеті Суррея проходила одноденна зустріч розробників ACE, яку відвідали переможці практичних тестів Тьюрінга, що проходили в рамках конкурсу на отримання премії Лёбнера: Роббі Гарнер (Robby Garner), Річард Уоллес (Richard Wallace), Ролл Карпентер (Rollo Carpenter). У числі запрошених доповідачів були Девід Хемілл (David Hamill), Хью Лёбнер і Хьюмен Ша.

Симпозіум суспільства AISB по тесту Тьюринга, 2008[ред.ред. код]

У 2008 році поряд з проведенням чергового конкурсу на здобуття премії Лёбнера, що проходив в Університеті Редінга (University of Reading), Товариство вивчення штучного інтелекту і моделювання поведінки (The Society for the Study of Artificial Intelligence and Simulation of Behavior - AISB) провело одноденний симпозіум, на якому обговорювався тест Тьюринга. Симпозіум організували Джон Бернден (John Barnden), Марк Бішоп (Mark Bishop), Хьюмен Ша і Кевін Ворвік. У числі доповідачів були директор Королівського інституту баронеса Сьюзан Грінфілд (Susan Greenfield), Сельмер Брінгсорд (Selmer Bringsjord), біограф Тьюринга Ендрю Ходжес (Andrew Hodges) і вчений Оуен Холланд (Owen Holland). Ніякої угоди про канонічні тести Тьюринга не з'явилося, однак Брінгсорд припустив, що більша премія сприятиме тому, що тест Тьюринга буде пройдений швидше.

Рік Алана Тьюринга і Тьюринг-100 в 2012[ред.ред. код]

У 2012 році відзначався ювілей Алана Т'юринга. Протягом всього року проходило безліч великих заходів. Багато з них проходили в місцях, які мали велике значення в житті Тьюринга: Кембридж, Манчестер і Блетчі Парк. Рік Алана Тьюринга керується організацією TCAC (Turing Centenary Advisory Committee), що здійснює професійну та організаційну підтримку заходів в 2012 році. Також підтримкою заходів займаються: ACM, ASL, SSAISB, [ http://www.bcs.org/ BCS], BCTCS, Блетчі Парк, [http: / /www.gap-system.org/~history/Societies/BMC.html BMC], BLC, [http: // www. computerconservationsociety.org/ CCS], Association CiE, EACSL, [http: //www.eatcs .org / EATCS], FoLLI, IACAP, IACR, KGS і LICS.

Для організації заходів з відзначення в червні 2012 року сторіччя з дня народження Т'юринга створений спеціальний комітет, завданням якого є донести думку Тьюринга про розумну машині, відображену в таких голлівудських фільмах, як «Той, що біжить по лезу», до широкого загалу, включаючи дітей. У роботі комітету беруть участь: Кевін Ворвік, голова, Хьюмен Ша, координатор, Ян Бланд (Ian Bland), Кріс Чапмен (Chris Chapman), Марк Аллен (Marc Allen), Рорі Данлоуп (Rory Dunlop), переможці конкурсу на здобуття премії Лёбнера Роббі Гарне і Фред Робертс (Fred Roberts). Комітет працює за підтримки організації «Жінки в техніці» (Women in Technology) і Daden Ltd.

На цьому конкурсі росіяни, імена яких не розголошувалися, представили програму « Eugene» [7]. У 150 проведених тестах (а по факту п'ятихвилинних розмовах) брали участь п'ять новітніх програм, які «загубилися» серед 25 звичайних людей. Програма «Eugene», яка зображала 13-річного хлопчика, який проживає в Одесі, стала переможцем, зумівши в 29,2% своїх відповідей ввести екзаменаторів в оману. Таким чином, програма не добрала всього 0,8% для повного проходження тесту.

Варіанти тесту Т'юринга[ред.ред. код]

Імітаційна гра згідно з описом Т"юринга в статті «Обчислювальні машини й розум». Гравець З шляхом завдання серії питань намагається визначити, хто з двох інших гравців - чоловік, а хто - жінка. Гравець А, чоловік, намагається заплутати гравця С, а гравець В намагається допомогти С.
Початковий тест на основі імітаційної гри, в якому замість гравця А грає комп'ютер. Комп'ютер тепер повинен запитати гравця С, в той час як гравець В продовжує намагатися допомогти ведучому.

Існують, принаймні, три основні варіанти теста Т'юринга, два з яких були запропоновані в статті «Обчислювальні машини й розум», а третій варіант, за термінологією Сола Трейджера (Saul Traiger), є стандартною інтерпретацією.

Поряд з тим, що існує певна дискусія, чи відповідає сучасна інтерпретація тому, що описував Т'юринг, або вона є результатом невірного тлумачення його робіт, все три версії не вважаються рівносильними, їх сильні і слабкі сторони розрізняються.

Посилання[ред.ред. код]

Примітки[ред.ред. код]

  1. other / turing-test.html Портал штучного інтелекту
  2. Комп'ютер вперше в історії зміг видати себе за людину
  3. [1] Хабрахабр. Тест Тьюринга пройден (на детском уровне сложности)
  4. Jabberwacky (англ.)
  5. Elbot (англ.)
  6. = 62564 Пройти тест Тьюринга не так-то просто // pcweek.ru
  7. {{cite web  | Url = http://www.itar-tass.com/c11/501481.html  | Title = Програма "Євген" майже пройшла текст математика Алана Тьюрінга  | Subtitle = Російські фахівці першими в світі впритул наблизилися до створення справжнього штучного розуму  | Author = Макарчев, Віталій  | Quote =  | Date = 2012-08-22  | Publisher = ІТАР-ТАСС  | Accessdate = 2014-06-09  | Lang =  | Description =  | Deadlink =  | Archiveurl = http://archive.is/UMZns  | Archivedate = 2014-06-09 }}