Релевантність

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Релева́нтність (англ. relevance) — міра відповідності отримуваного результату бажаному.

В термінах пошуку — це міра відповідності результатів пошуку завданню, поставленому в пошуковому запиті.

Нерелевантний документ — документ, що був відібраний у результаті інформаційного пошуку, але зміст якого не відповідає запиту користувача.

Визначає, наскільки повно той або інший документ відповідає критеріям, вказаним у запиті користувача. Необхідно враховувати, що в кожній пошуковій системі працює власна програма (спайдер), що індексує веб-сторінки, кожна система індексує сторінки своїм особливим способом і пріоритети при пошуку за індексами теж різні. Тому запит за одними і тими ж ключовими словами в кожній з пошукових систем породжує різні результати.

Релевантність пошуку[ред.ред. код]

Це є суб'єктивним поняттям, оскільки результати пошуку, які підходять для одного користувача, можуть не підходити для іншого.

Основним методом для оцінки релевантності є TF-IDF-метод, який використовується у більшості пошукових систем (як в інтернет-пошуковиках, так і у довідкових системах (MSDN). Його зміст зводиться до того, що чим більша локальна частота терміну (запиту) у документі (TF) і більша «рідкість» (тобто, чим рідше він зустрічається в інших документах) терміну у колекції (IDF), тим вище вага даного документу відносно терміну — тобто документ буде видаватись раніше у результатах пошуку за даним терміном. Автором методу є Gerard Salton (у подальшому дороблений Karen Sparck Jones).

Джерела[ред.ред. код]

Тлумачний словник з інтелектуальної власності. Основні терміни: понад 2000 термінів / Уклад.: М. Д. Гінзбург, Л. М. Дунаєвський, І. О. Требульова та ін.; За заг. ред. А. А. Рудника. — Харків, 1999. 560 с.

Посилання[ред.ред. код]


Комп'ютер Це незавершена стаття про комп'ютери.
Ви можете допомогти проекту, виправивши або дописавши її.