Описова статистика

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Описова статистика — дисципліна кількісного опису основних властивостей набору даних. Описова статистика відрізняється від статистики виводу (або індуктивної статистики) тим, що мета описової статистики — узагальнити вибірку, а не використовувати данні, щоб вивчити генеральну сукупність вимірів, які представляють вибірку даних. Взагалі кажучи, це означає, що описова статистика, на відміну від статистики виведення, не розроблена на основі теорії ймовірності. Деякі заходи, які зазвичай використовуються для опису наборів даних заходів центральної тенденції і заходи мінливості або дисперсії. Заходи центральної тенденції включають середні величини, медіану та моду, в той час як заходи мінливості включають стандартні відхилення (або дисперсії), мінімальне і максимальне значення змінних, коефіцієнт ексцесу та коефіцієнт асиметрії.

Використання в статистичному аналізі[ред.ред. код]

Описова статистика забезпечує короткий підсумок про вибірку та про спостереження, які були зроблені. Такі резюме можуть бути як кількісними, наприклад резюмуюча статистика, так і візуальна, наприклад прості графіки. Ці резюме можуть бути або основою початкового опису даних як частина більш обширного статистичного аналізу, або вони можуть бути достатніми самі по собі для конкретного дослідження.

Наприклад, розглянемо голи у відсотках в баскетболі, для використовуємо описову статистику, яка підсумовує виконанні гравцем або командою голи. Це число є кількість зроблених голів, поділена на кількість всіх кидків. Наприклад, гравець, який попадає з відсотком 33% — робить приблизно одне попадання з кожних трьох кидків. Відсоток підсумовує або описує кілька дискретних подій. Розглянемо також середній бал. Це єдине число описує загальну успішність студента по всьому спектру курсу.

Використання описової та сумарної статистики має багату історію. Справді, простий перепис населення та економічних даних був першою проблемою, якою зайнялась статистика. Зовсім недавно, колекція підсумкової методів була сформульована під заголовком дослідного аналізу даних, прикладом такого способу є «ящик з вусами».

У діловому світі, описова статистика дає змогу зведення безпеки, коли дослідники виконують емпіричний та аналітичний аналіз, так як він дають історичний нарис поведінки прибутків.

Одновимірний аналіз[ред.ред. код]

Одновимірний аналіз передбачає, що описують розподіл однієї змінної, включаючи його центральну тенденцію (у тому числі середні значення, медіану і моду) та дисперсію (включаючи діапазон і квантилі набору даних, та заходи з розповсюдження такі як дисперсія і стандартне відхилення). Форма розподілу може також бути описана за допомогою індексів, таких як дисперсія випадкової величини та стандартне відхилення. Особливості розподілу змінної також можуть бути зображеними у графічному або табличному форматі, включаючи гістограми і діаграму «стовбур — листя».

Двовимірний аналіз[ред.ред. код]

Коли модель складається з більш ніж однієї змінної, описова статистика може бути використана для опису відносин між парами змінних. У цьому випадку, описові статистичні дані включають в себе:
• Перехресні таблиці та таблиці спряженості
• Графічне представлення за допомогою діаграми розсіювання
• Кількісні показники залежності
• Описи умовних розподілів

Основною причиною для диференціації одновимірного і двовимірного аналізу є те, що двовимірний аналіз — це не тільки просто описовий аналіз, а й опис стосунків між двома різними змінними. Кількісні показники залежності включають коефіцієнти кореляції (наприклад,коефіцієнт Пірсона або Спірмана) і коваріаційний. Нахил в регресійному аналізі також відображає відношення між змінними. Нестандартизований нахил вказує на одиницю заміни змінної для критерію зміни змінних в одній системі виміру. Стандартизованих схил вказує, що це зміна в стандартних одиницях виміру. Вкрай нерівномірні дані часто можна перетворити за допомогою логарифмів. Використання логарифмів робить графіки більш симетричними і виглядають більш схожими на нормальний розподіл, завдяки чому їх легше інтерпретувати.