Аналіз даних

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Аналіз даних — розділ математики, що займається розробкою методів обробки даних незалежно від їх природи.

Аналіз даних включає виконання послідовних, логічних дій з інтерпретації зібраних даних (наприклад, відповідей респондентів) та їх перетворення на статистичні форми, потрібні для ухвалення маркетингових та керівницьких рішень.

Можна виділити такі етапи аналізу даних: отримання даних, обробка, аналіз та інтерпретація результатів обробки.

Аналіз даних можна вважати прикладним розділом математичної статистики, проте потрібно наголосити, що аналіз даних охоплює обробку як кількісних, так і якісних даних. Причому, не обов'язково використання імовірністних моделей в описі досліджуваних об'єктів, явищ та процесів.

Якщо даних занадто багато, то ми маємо такі варіанти подальшої роботи:

  1. Обробляюти тільки частину, а все інше залишити наступникам.
  2. Аналізувати всі дані, і вибрати найінформативніші частини.
  3. Групувати дані

Групування даних має на меті їх стиснення без суттєвої втрати вибіркою інформативності, та полегшити подальшу обробку.

Хай наприклад маємо набір результатів вимірювань величини .

Тепер знаходимо межі проміжку на якому вони знаходяться: .

Розбиваємо цей проміжок на m рівних частин. Для кожного проміжку записуємо його середину, та кількість величин в ньому.

Також можна задати умову того, що в кожному проміжку має бути не менше k значень. В такому разі, той проміжок в якому їх менше, об'єднують з одним із сусідніх.

Розділи аналізу даних[ред. | ред. код]

  1. Попередня обробка даних
    1. Розвідувальний аналіз
  2. Кореляційний аналіз
  3. Дисперсійний аналіз
  4. Регресійний аналіз
  5. Коваріаційний аналіз
  6. Дискримінантний аналіз
  7. Кластерний аналіз
  8. Аналіз часових рядів

Тестові набори даних[ред. | ред. код]