Кластеризація документів

Матеріал з Вікіпедії — вільної енциклопедії.
Версія від 11:28, 7 листопада 2017, створена Vlasenko D (обговорення | внесок) (уточнення)
Перейти до навігації Перейти до пошуку

Кластериза́ція докуме́нтів — одне із завдань інформаційного пошуку. Метою кластеризації документів є автоматичне виявлення груп семантично схожих документів серед заданої фіксованої множини документів. Слід зазначити, що групи формуються тільки на основі попарної схожості описів документів, і ніякі характеристики цих груп не задаються заздалегідь, на відміну від класифікації документів, де категорії задаються заздалегідь.

Див. також