Вибірка
Матеріал з Вікіпедії — вільної енциклопедії.
Вибірка — множина випадків (об'єктів, подій, зразків), за допомогою визначеної процедури вибраних з статистичної популяції для участі в дослідженні. Зазвичай, розміри популяції дуже великі, що робить прийняття до уваги від всіх членів популяції непрактичним або неможливим. Вибірка представляє собою підмножину певного розміру, члени якої збираються і статистичні дані обчислюється таким чином, що в результаті можна зробити висновки або екстраполяцію із вибірки на всю популяцію.
Зміст |
[ред.] Математичний опис
У математичних термінах, для наданих випадкової змінної X з розподілом F, вибірка довжини n = 1,2,3… — набір n незалежних, однаково розподілених (НОР) випадкових змінних з розподілом F.
Вибірка представляє n експериментів, в яких можна виміряти ту ж змінну. Наприклад, якщо X представляє висоту індивідуума і ми вимірюємо n індивідуумів, Xi буде висотою i-того індивідуума. Відзначте, що вибірка випадкових змінних (тобто набір вимірних функцій) не повинна бути змішаною з реалізаціями цих змінних (які є значеннями, що приймають ці випадкові змінні). Іншими словами, Xi — функція, що представляє собою вимірювання в i-тому експерименті і xi = Xi(ω) — значення, яке ми фактично отримуємо, роблячи вимірювання.
Поняття вибірки включає процес того, як отримуються дані (тобто, випадкові змінні). Це необхідно робити таким чином, щоб можна біло зробити математичні твердження про вибірку, як і отримати статистичні дані, розраховані на її основі, наприклад середнє значення і коваріація вибірки. Крім того, такі статистичні дані повинні мати місце і для всієї популяції.
[ред.] Об'єм вибірки
Об'єм вибірки — число випадків, включених у вибіркову сукупність. Із статистичних міркувань рекомендується, щоб число випадків складало не менше 30—35.
[ред.] Залежні і незалежні вибірки
При порівнянні двох (і більш) вибірок важливим параметром є їх залежність. Якщо можна встановити гомоморфну пару (тобто, коли одному випадку з вибірки X відповідає один і лише один випадок з вибірки Y) для кожного випадку в двох вибірках (і цей взаємозв'язок є важливим для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:
- пари близнят
- два вимірювання якої-небудь ознаки до і після експериментальної дії
- чоловіки і дружини
- тощо
У випадку, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними, наприклад:
- чоловіки і жінки
- психологи і математики.
Відповідно, залежні вибірки завжди мають однаковий об'єм, а об'єм незалежних може відрізнятися. Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:
[ред.] Репрезентативність
Вибірка може розглядатися як репрезентативна або нерепрезентативна.
Довідка: РЕПРЕЗЕНТАТИВНИЙ (рос. репрезентативный, англ. representative, нім. repräsentativ) – представницький, характерний, типовий для чого-небудь. Напр., репрезентативна вибірка – множина випадкових чисел (об’єктів), які характеризують генеральну сукупність.
[ред.] Приклад нерепрезентативної вибірки
У США одним з найбільш відомих історичних прикладів нерепрезентативної вибірки вважається випадок, що відбувся під час президентських виборів в 1936 року[1]. Журнал «Літрері Дайджест», що успішно прогнозував події декількох попередніх виборів, помилився в своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм підписчикам, людям, вибраним по телефонним книгах всієї країни, і людям з реєстраційних списків автомобілів. У 25 % бюлетенів (майже 2,5 мільйона) голосів, що повернулися, були розподілені таким чином:
- 57 % віддавали перевагу кандидату-республіканцю Альфу Лендону
- 40 % вибрали діючого на той час президента-демократа Франкліна Рузвельта На дійсних же виборах, як відомо, переміг Рузвельт, набравши більше 60 % голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, — оскільки їм було відомо, що більшість їхніх передплатників вважають себе республіканцями, — вони розширили вибірку за рахунок людей, вибраних з телефонних книг і реєстраційних списків. Проте вони не врахували сучасних ним реалій і насправді набрали ще більше республіканців: у час Великої депресії володіти телефонами і автомобілями могли собі дозволити в основному представники середнього і верхнього класу (тобто більшість республіканців, а не демократів).
[ред.] Види плану побудови груп з вибірок
Виділяють декілька основних видів плану побудови груп[2]:
- Дослідження з експериментальною і контрольною групами, які ставляться в різні умови.
- Дослідження з експериментальною і контрольною групами із залученням стратегії попарного відбору
- Дослідження з використанням тільки однієї групи — експериментальною.
- Дослідження з використанням змішаного (чинника) плану — всі групи ставляться в різні умови.
[ред.] Стратегії побудови груп
Відбір груп для їх участі в медичних та психологічних експериментах здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої і зовнішньої валідності[3].
- Рандомізація (випадковий відбір)
- Попарний відбір
- Стратометрічний відбір
- Наближене моделювання
- Залучення реальних груп
[ред.] Рандомізація
Рандомізація, або випадковий відбір, використовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною імовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку з 100 студентів внз, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з неї 100 папірців — це буде випадковим відбором (Гудвін Дж., з. 147).
[ред.] Попарний відбір
Попарний відбір — стратегія побудови груп вибірки, при якому групи випробовуваних складаються з суб'єктів/об'єктів, еквівалентних по значущих для експерименту побічних параметрах. Дана стратегія ефективна для експериментів з використанням експериментальних і контрольних груп з кращим варіантом у випадку психологічних дослідженнях — залученням близнюкових пар (моно- і дізіготних).
[ред.] Стратометрічний відбір
Стратометрічний відбір — рандомізація з виділенням страт (або кластерів). При даному способі формування вибірки, генеральна сукупність ділиться на групи (страти), що володіють певними характеристиками (у випадку психологічних досліджень — стать, вік, політичні переваги, освіта, рівень доходів і ін.), і відбираються випробовувані з відповідними характеристиками.
[ред.] Наближене моделювання
Наближене моделювання — складання обмежених вибірок і узагальнення виводів про цю вибірку на ширшу популяцію. Наприклад, при участі в медичному/психологічному дослідженні студентів 2-го курсу університету, дані цього дослідження розповсюджуються на «людей у віці від 17 до 21 року». Допустимість подібних узагальнень украй обмежена.
[ред.] Посилання
- ↑ Исследование в психології: методи і планування / Дж. Гудвін. — Спб.: Пітер, 2004. З. 146.
- ↑ Дружинин В. Н. Експериментальна психологія. — 2-е видавництво, доп. — Спб.: Пітер, 2002. З. 92
- ↑ См. там же. З. 93—95.
[ред.] Література
Наследов А. Д. Математические методы психологического исследования. СПб.: Речь, 2004.
[ред.] Див. також
| Це незавершена стаття з математики. Ви можете допомогти проекту, виправивши або дописавши її. |

