Добування даних
Добува́ння да́них (англ. data mining), також глиби́нний ана́ліз да́них[джерело?] — процес напівавтоматичного аналізу великих баз даних з метою пошуку корисних фактів[1]. Зазвичай поділяють на задачі класифікації, моделювання та прогнозування.[джерело?]
На сучасних підприємствах, в дослідницьких проектах або в інтернеті утворюються великі обсяги даних. Глибинний аналіз даних здійснюється автоматично шляхом застосування методів математичної статистики, штучних нейронних мереж, теорії нечітких множин або генетичних алгоритмів. Метою аналізу є виявлення правил та закономірностей, наприклад, статистичних подій. Так, наприклад, можливо виявити зміни у поведінці клієнтів або груп клієнтів для покращення стратегії підприємства.
Задачі[ред. | ред. код]
![]() | Цей розділ потребує доповнення. (жовтень 2008) |
Методи розв'язання[ред. | ред. код]
![]() | Цей розділ потребує доповнення. (жовтень 2008) |
Нейронні мережі[ред. | ред. код]
Штучні нейронні мережі названі на основі схожості їхньої будови із нейронними зв'язками мозку людини. Дозволяють реалізовувати задачі кластеризації, класифікації, прогнозування. Після створення основ теорії нейронних мереж, вони зазнали значної критики і вважалося, що вони малопридатні для сфери штучного інтелекту. Проте відновленню інтересу до штучних нейронних мереж сприяв розвиток комп'ютерів та успіх в теоретичних та прикладних дослідженнях.[2]
Дерева рішень[ред. | ред. код]
Метод для розв'язання задачі класифікації. Результатом застосування цього методу до навчального матеріалу є ієрархічна структура правил типу «якщо … тоді … інакше …». Ця структура має вигляд дерева. Для визначення приналежності об'єкта до одного з класів слід надавати відповіді на запитання, що знаходяться у вершинах цього дерева. Розпочавши з кореня дерева, алгоритм завершується після досягнення тупикової вершини (листа), ця вершина і визначатиме клас, до якого належить об'єкт.[3]
Еволюційні алгоритми[ред. | ред. код]
Регресійний аналіз[ред. | ред. код]
Регресійний аналіз займається методами аналізу залежності однієї величини від іншої. На відміну від кореляційного аналізу, не з'ясовує, чи істотний зв'язок, а займається пошуком моделі цього зв'язку, вираженої у функції регресії.
Застосування[ред. | ред. код]
Див. також[ред. | ред. код]
Література[ред. | ред. код]
- Silberschatz, Abraham; Sudarshan, S. (2011). Database system concepts (вид. 6). New York: McGraw-Hill. ISBN 9780073523323. OCLC 436031093.
Джерела[ред. | ред. код]
- ↑ Silberschatz та Sudarshan, 2011, с. 25.
- ↑ Wang, Lipo; Fu, Xiuju (2005). Data mining with computational intelligence. Berlin: Heidelberg : Springer. с. 6. ISBN 3-540-24522-7. Архів оригіналу за 8 листопада 2016. Процитовано 21 липня 2017.
- ↑ Encyclopedia of artificial intelligence / Juan Ramon Rabunal Dopico, Julian Dorado de la Calle, and Alejandro Pazos Sierra, editors
Посилання[ред. | ред. код]
- Методи отримання даних [Архівовано 20 липня 2017 у Wayback Machine.](рос.)
- Визначення Data Mining
![]() |
Це незавершена стаття з інформатики. Ви можете допомогти проєкту, виправивши або дописавши її. |
|