Вікіпедія:Quarry

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Quarry
Quarry-logo.svg
Quarry screenshot.EpochFail query.png
Знімок екрану Quarry
Тип сторінка внутрішнього призначення проекта фонду Вікімедіа[d]
Автор(и) Yuvi Panda
Репозиторій github.com/wikimedia/analytics-quarry-web
Написано на Python
quarry.wmflabs.org

Quarry у Вікісховищі?

Quarry (англійською кар’єр, назва подібна до англ. Queryзапит) — загальнодоступний інтерфейс до Labs DB, набору постійно оновлюваних копій SQL баз даних вікісайтів проектів Вікімедіа. Quarry спроектований для простого запуску запитів до Labs DB. Quarry також дозволяє ділитися переглядати запити інших та ділитися своїми запитами. Коритсувачі Quarry мають погодитися з Умовами використання Labs.

quarry.wmflabs.org

Написання і запуск SQL запитів[ред. код]

Вибір бази даних[ред. код]

За замовчуванням Quarry запитує базу даних англомовної Вікіпедії ("enwiki_p"). Ви можете використовувати базу будь якого іншого вікісайту почавши ваш запит рядком USE <dbname>_p;. Наприклад, наступний SQL запит повертає кількість редагувань зроблених користувачем "Ilya" в українській Вікіпедії із 1 січня 2016 року.

USE ukwiki_p;

SELECT COUNT(*) 
FROM revision_userindex 
WHERE 
    rev_user_text = "Ilya" AND 
    rev_timestamp >= "20160101";

Назва бази даних зазвичай складається із коду мови та вікі-родини (wiki для Вікіпедії, wikibooks для Вікіпідручника тощо). Для багатомовних вікі назва бази складається і назви сайту і wiki, наприклад commonswiki, wikidatawiki. Дивіться повний перелік: https://quarry.wmflabs.org/query/278.

Доступні таблиці та колонки[ред. код]

Для огляду наявних таблиць та колонок дивіться Схему бази MediaWiki. Деякі додаткові таблиці розширень також доступні, вони мають бути описані на сторінці документації відповідного розширення. Однак не всі можливі дані доступні. Наступні — ні:

  • Таблиця text, що містить текст версій статей відсутня.
  • Приватні дані вилучені.

Також таблиці revision і logging не мають індексів на колонках користувачів. Натомість ви можете використати таблиці revision_userindex і logging_userindex (дивіться wikitech:Help:Tool_Labs/Database#Tables for revision or logging queries involving user names and IDs)

Щоб отримати повний список таблиці запустіть запит (замініть enwiki_p на необхідну вам базу даних):

SHOW TABLES FROM enwiki_p;

Для отримання схеми таблиці ви можете використати DESCRIBE (https://quarry.wmflabs.org/query/585)

DESCRIBE ukwiki_p.page;
Кнопка завантаження результатів

Завантаження результату[ред. код]

Вибір формату для завантаження результатів

Quarry дозволяє завантажити результати запиту. Кнопка завантаження одразу перед результатами запиту дозволяє отримати їх у форматах CSV, TSV, JSON та вікі-таблиць. Ви можете також отримати результат програмно із інших інструментів.

Формат http запиту
https://quarry.wmflabs.org/run/ID_запиту/output/номер_запуску/<csv|json|tsv|wikitable>
Наприклад
https://quarry.wmflabs.org/run/1534/output/0/json
Відповідь
{"headers": ["COUNT(*)"], "rows": [[88]]}

Інтервікі посилання[ред. код]

Існує код інтервікі посилання quarry: для простішого посилання на запити, наприлад.

Дивіться також[ред. код]