Подвійний графік

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Подвійний графік представляє собою тип пошукового графа, який використовується в статистиці як узагальнення простих двох змінних діаграми розсіювання. Подвійний графік дозволяє інформації на обох зразках і змінних матриці даних відображатися в графічному вигляді. Зразки відображаються у вигляді точок, в той час як змінні відображаються або у вигляді векторів, лінійних осей або нелінійних траєкторій. У разі категоріальних змінних, точки категорії рівня можуть бути використані для подання рівнів категоріальної змінної. Узагальнений подвійний графік відображає інформацію про безперервні, категоріальні змінні.

Історія[ред. | ред. код]

Подвійний графік був введений К. Рубеном Гавриїлом (1971). Говер і Хенд (1996) написали монографію про подвійний графік. Ян і Кан (2003) описали різні методи, які можуть бути використані для того, щоб візуалізувати і інтерпретувати подвійний графік. Книга Грінакре (2010) являє собою практичне, орієнтоване на користувача, керівництво по подвійному графіку, а також за допомогою скриптів на мові програмування R, відкритим вихідним кодом для генерування подвійного графіку, пов'язаним з аналізом відповідності(АВ), багатовимірним шкалюванням (БШ), лінійним дискримінантним аналізом (ЛДА) -також відомий як спектральне відображення-аналіз дискримінанту (АД) і різні форми аналізу відповідності: простий аналіз відповідностей, багатовимірного аналізу відповідностей і канонічного аналізу відповідностей. Книга Гауер, Люббе і Ле Рокса (2011) має на меті популяризацію подвійного графіка як корисного і надійного методу для візуалізації багатовимірних даних, коли дослідники хочуть розглянути, наприклад, аналіз головних компонент, канонічних змінних аналіз або різні види аналізу відповідності.

Будування[ред. | ред. код]

Подвійний графік будується за допомогою сингулярного розкладу матриці(або СРМ), щоб отримати наближення низького рангу до перетвореної версії матриці даних X, чиї n-рядки це рядки вибірки (випадки, або об'єкти), і чиї р-стовпці є змінними. Перетворені матриці даних Y виходить з вихідної матриці X за допомогою центруючих і, необов'язково, стандартизацію стовпці (змінні). Використовуючи СРМ, ми можемо написати Y = ∑k=1,...pdkukvkT;, де uk є n-мірні вектори-стовпці, vk є р-мірні вектори-стовпці, а dk є не зростаюча послідовність невід'ємних скаляр. Подвійний графік формується з двох діаграм розсіювання, які поділяють загальний набір осей і мають між-набір скалярную інтерпретацію продукту. Перша діаграма розсіювання формується з точок (d1αu1i,  d2αu2i), для i = 1,...,n. Друга ділянка формується з точок (d11−αv1jd21−αv2j), for j = 1,...,p. Це подвійний графік, який формується домінуючими двома умовами СРМ, який потім може бути представлений ​​в двовимірному дисплеї. Типові варіанти вектора а це 1 (щоб дає відстань для відображення рядка) і 0 (щоб показати відстань для відображення стовпців), а в деяких рідкісних випадках α = 1/2, щоб отримати симетрично масштабуємий подвійний графік (що не дає ніякої відстані рядків або стовпців, але тільки показує скалярний добуток). Безліч точок, що зображують змінні можуть бути відображені у вигляді стрілок, щоб підкреслити думку про те, що вони представляють подвійний графік осі, на якому зразки можуть бути спроектовані для апроксимації вихідних даних.

Примітки[ред. | ред. код]


Посилання[ред. | ред. код]