Згруповані дані

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Приклад[ред.ред. код]

Ідею згрупованих даних можна проілюструвати, розглянувши наступний необроблений набір даних:

Таблиця 1: Час, витрачений (в секундах) групою студентів для відповіді на просте математичне питання
20 25 24 33 13
26 8 19 31 11
16 21 17 11 34
14 15 21 18 17

Наведені вище дані можуть бути організовані у вигляді частотного розподілу (або згрупованих даних) декількома способами. Один із способів полягає у використанні інтервалів як основи.

Найменше значення в наведених вище даних є 8 і найбільшим є 34. Інтервал від 8 до 34 розбитий на більш дрібні підінтервали (так звані інтервали класу). Для кожного класу інтервалів, кількість елементів даних, що входять в цей інтервал відраховується. Це число називається частотою цього класу інтервалу. Результати зведені в таблицю у вигляді таблиці частот наступним чином:

Таблиця 2: Розподіл частоти цього часу (в секундах) групою студентів для відповіді на просте математичне питання
Витрачений час(у секундах) Частота
5 ≤ t < 10 1
10 ≤ t < 15 4
15 ≤ t < 20 6
20 ≤ t < 25 4
25 ≤ t < 30 2
30 ≤ t < 35 3

Інший спосіб угруповання даних є використання деяких якісних характеристик замість числових інтервалів. Наприклад, припустимо, що в наведеному вище прикладі, існує три типи студентів: 1) нижче нормальної, якщо час реакції складає від 5 до 14 секунд, 2) нормальна, якщо воно становить від 15 до 24 секунд, 3) вище нормальної, якщо вона становить 25 секунд або більше, то згруповані дані виглядають так:

Таблиця 3: Розподіл частоти трьох типів студентів
Частота
Нижче норми 5
Норма 10
Вище норми 5

Середнє значення згрупованих даних[ред.ред. код]

Оцінка середнього значення сукупності, , з якої дані можуть бути обчислені з згрупованих даних, як:

У цій формулі х відноситься до середньої точки інтервалів класу, і F є частотою класу. Слід зазначити, що результат цього буде відрізнятися від вибірки середнього. Середнє значення для згрупованих даних в наведеному вище прикладі, можна розрахувати наступним чином:

Клас інтервалів Частота ( f ) Середнє значення (x) f x
5 та вище, нижче 10 1 7.5 7.5
10 ≤ t < 15 4 12.5 50
15 ≤ t < 20 6 17.5 105
20 ≤ t < 25 4 22.5 90
25 ≤ t < 30 2 27.5 55
30 ≤ t < 35 3 32.5 97.5
Разом 20 405

Таким чином, середнє значення згрупованих даних є:

Див. також[ред.ред. код]

Посилання[ред.ред. код]

  • Newbold, P.; Carlson, W.; Thorne, B. (2009). Statistics for Business and Economics (вид. Seventh). Pearson Education. ISBN 978-0-13-507248-6.