Вибірка

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Вибірка — це множина об'єктів, подій, зразків або сукупність вимірів, за допомогою визначеної процедури вибраних з статистичної популяції або генеральної сукупності для участі в дослідженні. Зазвичай, розміри популяції дуже великі, що робить прийняття до уваги всіх членів популяції непрактичним або неможливим. Вибірка являє собою множину або сукупність певного обсягу, члени якої збираються і статистичні характеристики обчислюються таким чином, що в результаті можна зробити висновки або екстраполяцію із вибірки на всю популяцію або генеральну сукупність.

Математичний опис[ред.ред. код]

У математичних термінах, для даної статистичної змінної X з вибірковим розподілом F, вибірка обсягу n = 4,5…  являє собою сукупність n незалежних вимірів, показникам якої приписуються статистичні ймовірності.

Вибірка представляє n експериментів, в яких можна виміряти ту ж змінну. Наприклад, якщо X представляє висоту індивідуума і ми вимірюємо n індивідуумів, X_i буде висотою i-того індивідуума. Відзначте, що вибірка випадкових змінних (тобто набір вимірних функцій) не повинна бути змішаною з реалізаціями цих змінних (які є значеннями, що приймають ці випадкові змінні). Іншими словами, X_i — функція, що являє собою вимірювання в i-тому експерименті і x_i=X_i(\omega) — значення, яке ми фактично отримуємо, роблячи вимірювання.

Характеристикою положення для вибіркового розподілу є вибіркове середнє, а характеристиками розсіювання вибіркового розподілу — вибіркові дисперсії. Числовою характеристикою вибірки є також розмах її значень.

Поняття вибірки включає процес того, як отримуються дані (тобто, випадкові змінні). Це необхідно робити таким чином, щоб можна було зробити математичний аналіз вибірок, як і отримати статистичні дані, розраховані на їх основі, наприклад вибіркові середні, коваріацію вибірок. Крім того, такі статистичні дані повинні мати місце і для всієї популяції.

Обсяг вибірки[ред.ред. код]

Обсяг вибірки — число випадків, включених у вибіркову сукупність. Із статистичних міркувань рекомендується, щоб число випадків становило не менше 30—35.

Залежні і незалежні вибірки[ред.ред. код]

При порівнянні двох (і більш) вибірок важливим параметром є їх залежність. Якщо можна встановити гомоморфну пару (тобто, коли одному випадку з вибірки X відповідає один і лише один випадок з вибірки Y) для кожного випадку в двох вибірках (і цей взаємозв'язок є важливим для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:

  • пари близнят
  • два вимірювання якої-небудь ознаки до і після експериментальної дії
  • чоловіки і дружини
  • тощо

У випадку, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними, наприклад:

Відповідно, залежні вибірки завжди мають однаковий об'єм, а об'єм незалежних може відрізнятися. Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:

Репрезентативність[ред.ред. код]

Вибірка може розглядатися як репрезентативна або нерепрезентативна.

Довідка: РЕПРЕЗЕНТАТИВНИЙ (рос. репрезентативный, англ. representative, нім. repräsentativ) – представницький, характерний, типовий для чого-небудь. Наприклад, репрезентативна вибірка – сукупність випадкових чисел, в якій визначається множина елементів вибірки, що характеризує генеральну сукупність.

Якщо вибірка являє собою числову змінну, наприклад зріст або вік людей, тоді репрезентативність такої вибірки визначають залежно її наповненості і добротності.

Приклад нерепрезентативної вибірки[ред.ред. код]

У США одним з найвідоміших історичних прикладів нерепрезентативної вибірки вважається випадок, що стався під час президентських виборів в 1936 року[1]. Журнал «Літрері Дайджест», що успішно прогнозував події декількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм підписчикам, людям, вибраним по телефонним книгах всієї країни, і людям з реєстраційних списків автомобілів. У 25 % бюлетенів (майже 2,5 мільйона) голосів, що повернулися, були розподілені таким чином:

  • 57 % віддавали перевагу кандидату-республіканцю Альфу Лендону
  • 40 % вибрали діючого на той час президента-демократа Франкліна Рузвельта
    На дійсних же виборах, як відомо, переміг Рузвельт, набравши понад 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, — оскільки їм було відомо, що більшість їхніх передплатників вважають себе республіканцями, — вони розширили вибірку за рахунок людей, вибраних з телефонних книг і реєстраційних списків. Проте вони не врахували тогочасних реалій і насправді набрали ще більше республіканців: у часи Великої депресії володіти телефонами і автомобілями могли собі дозволити переважно представники середнього і верхнього класу (в більшості республіканці, а не демократи).

Види плану побудови груп з вибірок[ред.ред. код]

Виділяють декілька основних видів плану побудови груп[2]:

  1. Дослідження з експериментальною і контрольною групами, які ставляться в різні умови.
    • Дослідження з експериментальною і контрольною групами із залученням стратегії попарного відбору
  2. Дослідження з використанням тільки однієї групи — експериментальною.
  3. Дослідження з використанням змішаного (чинника) плану — всі групи ставляться в різні умови.

Стратегії побудови груп[ред.ред. код]

Відбір груп для їх участі в медичних та психологічних експериментах здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої і зовнішньої валідності[3].

Рандомізація[ред.ред. код]

Рандомізація, або випадковий відбір, використовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною імовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку з 100 студентів внз, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з неї 100 папірців — це буде випадковим відбором (Гудвін Дж., з. 147).

Попарний відбір[ред.ред. код]

Попарний відбір — стратегія побудови груп вибірки, при якому групи випробовуваних складаються з суб'єктів/об'єктів, еквівалентних по значущих для експерименту побічних параметрах. Дана стратегія ефективна для експериментів з використанням експериментальних і контрольних груп з кращим варіантом у випадку психологічних дослідженнях — залученням близнюкових пар (моно- і дізіготних).

Стратометричний відбір[ред.ред. код]

Стратометричний відбір — рандомізація з виділенням страт (або кластерів). При даному способі формування вибірки, генеральна сукупність ділиться на групи (страти), що володіють певними характеристиками (у випадку психологічних досліджень — стать, вік, політичні переваги, освіта, рівень доходів і ін.), і відбираються випробовувані з відповідними характеристиками.

Наближене моделювання[ред.ред. код]

Наближене моделювання — складання обмежених вибірок і узагальнення виводів про цю вибірку на ширшу популяцію. Наприклад, при участі в медичному/психологічному дослідженні студентів 2-го курсу університету, дані цього дослідження розповсюджуються на «людей у віці від 17 до 21 року». Допустимість подібних узагальнень украй обмежена.

Посилання[ред.ред. код]

  1. Исследование в психології: методи і планування / Дж. Гудвін. — Спб.: Пітер, 2004. З. 146.
  2. Дружинин В. Н. Експериментальна психологія. — 2-е видавництво, доп. — Спб.: Пітер, 2002. З. 92
  3. См. там же. З. 93—95.

Література[ред.ред. код]

Наследов А. Д. Математические методы психологического исследования. СПб.: Речь, 2004.

Дивіться також[ред.ред. код]