Карен Спарк Джонс

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Карен Спарк Джонс

Karen Spärck.jpg

Карен Спарк Джонс в 2002 році
Народилася 26 серпня 1935(1935-08-26)[2]
Гаддерсфілд, Велика Британія[3]
Померла 4 квітня 2007(2007-04-04)[4][2] (71 рік)
Willinghamd, South Cambridgeshired, Кембриджшир[d], Кембриджшир, Східна Англія, Англія, Велика Британія[3]
·злоякісна пухлина[3]
Країна Flag of the United Kingdom.svg Велика Британія
Діяльність інформатик, викладачка університету, artificial intelligence researcher
Alma mater Girton Colleged[5]
Галузь інформатика
Заклад Ньюнгем коледжd[3] і Wolfson Colleged[5]
Науковий керівник Річард Брейтуейт
Членство Британська академія і Асоціація з розвитку штучного інтелекту
Відома завдяки: Творець концепції IDF
У шлюбі з Роджер Нідгем[3]
Нагороди
Особ. сторінка cl.cam.ac.uk/archive/ksj21

Карен Спарк Джонс (26 серпня 1935, Гаддерсфілд — 4 квітня 2007, Кембриджшир) — британський учений в галузі інформатики. Член британської академії.

Спарк зробила значний внесок у дві окремі області: інформаційний пошук (ІП) та обробка природної мови (ОПМ). В останні роки свого життя вона займалася інтеграцією цих напрямків в основні блок-схеми штучного інтелекту. Її найбільш важливим внеском є створення концепції обліку ваги слів зворотної частоти документа (IDF), яку вона описала в статті в 1972 році. На сьогоднішній день IDF використовується в багатьох пошукових системах, зазвичай, у складі схеми TF-IDF.

Біографія[ред. | ред. код]

Походження[ред. | ред. код]

Карен Спарк Джонс народилася в місті Гаддерсфілді графства Йоркшир в Англії. Її батьком був Оуен Джонс — викладач хімії, а матір'ю — норвежка Іда Спарк, яка переїхала до Великої Британії під час Другої світової війни. Оуен і Іда покинули Норвегію на одному з останніх кораблів після німецького вторгнення 1940 року.

Кар'єра[ред. | ред. код]

Карен Спарк Джонс навчалася в гімназії Гаддерсфілд, а потім в Кембріджському коледжі з 1953 по 1956 рік. Там вивчала історію, але на останньому році навчання захопилася філософією (тоді вона називалася Моральні науки (англ. Moral Sciences))і після закінчення навчання прийняла запрошення Маргарет Мастерман[en][6] на вступ до мовно дослідного відділу Кембриджського університету. Перш ніж перейти до дослідницької роботи в галузі інформатики, вона недовго пропрацювала вчителем в школі.

Стаття, написана Спарк спільно з Мастерман та Нідгемом, і опублікована у 1958 році, називається «Аналогія між машинним перекладом та пошуком в бібліотеці»[7]. 1968 року Спарк перевели з ЯІОКУ в комп'ютерну лабораторію при Кембриджському університеті[en] Ньюнгем-колледжа[en]. До того часу вона вже 3 роки була співробітником Ньюнгем-коледжу. А потім стала членом Лондонської королівської спільноти. Там вона почала свою кар'єру в області ІП, в якій вона стала світовим авторитетом.

До того, як Спарк була переведена в Кембриджський університет, вона написала дисертацію на тему «Синонімія та семантична класифікація» 1964 року при Кембриджському мовному дослідницькому підрозділі під керівництвом Маргарет Мастерман та її чоловіка, філософа Річарда Брейтуейта[en]. Ця робота сильно випереджала свій час і була опублікована лише двадцять років потому в статті на тему ШІ в Единбургському університеті. Насправді, це було перше застосування статистичних методів кластеризації для лексичних даних. Це було амбітною спробою створити деяке уявлення про примітивні поняття машинного перекладу на емпіричній основі. Алгоритми, які вона використовувала, були з теорії про «згустки» («Theory of Clumps»). Основним джерелом натхнення для Спарк був її чоловік Роджер Нідгем і її керівник Маргарет Мастерман [6].

Концепція IDF[ред. | ред. код]

Карен Спарк Джонс зробила значний внесок у галузі: ІП і ОЕЯ[8], а також створила концепцію обліку вагів слів зворотної частоти документа (IDF), яку вона описала в статті в 1972-му році.[9] IDF (inverse document frequency — зворотна частота документа) — інверсія частоти, з якою деяке слово зустрічається в документах колекції. Облік IDF зменшує вагу широковживаних слів. Для кожного унікального слова в межах конкретної колекції документів існує лише одне значення ID. Проводиться щорічна лекція «British Computer Society», названа на її честь[10]. Протягом її кар'єри в галузі інформатики, вона намагалася залучити жінок для роботи в даній області [11] (її гасло — «обчислення занадто важливі, щоб залишати їх чоловікам»), а також була хорошим наставником для студентів[12].

Останні роки життя[ред. | ред. код]

Карен Спарк Джонс померла від раку 4-го квітня 2007 року в місті Уіллінгемі графства Кембриджшир. Була організована та проведена зустріч в комп'ютерній лабораторії Кембриджського університету, щоб віддати данину пам'яті та поваги[13].

Особисте життя[ред. | ред. код]

Карен Спарк Джонс була заміжня за своїм товаришем, ученим Кембриджського університету Роджером Нідгемом. Вони побудували свій будинок в селі Котон[en] (близько 3 км на захід від Кембриджа в графстві Кембриджшир, Англія). Вранці вони працювали вдома, повертаючись на своє робоче місце лише після полудня. Вони жили довго та щасливо в скромному дерев'яному будинку протягом багатьох років, поки шум від шосе М11[en] не змусив їх покинути це місце.[14]


Почесті[ред. | ред. код]

  • Член AAAI;
  • Член ECCAI;
  • Стала президентом Association for Computational Linguistics 1994 року.

Нагороди[ред. | ред. код]

  • ACL Lifetime Achievement Award (2004)
  • ACM-AAAI Allen Newell Award (2007)

Література[ред. | ред. код]

Примітки[ред. | ред. код]