Вікіпедія:Quarry
Тип | інструмент Вікімедіаd і клієнт SQLd |
---|---|
Автор | Yuvi Panda |
Мова програмування | Python |
Ліцензія | MIT[1] |
Репозиторій | github.com/toolforge/quarry |
Вебсайт | quarry.wmflabs.org |
Quarry (англійською кар’єр, назва подібна до англ. Query — запит) — загальнодоступний інтерфейс до Labs DB, набору постійно оновлюваних копій SQL баз даних вікісайтів проєктів Вікімедіа. Quarry спроєктований для простого запуску запитів до Labs DB. Quarry також дозволяє переглядати запити інших та ділитися своїми запитами. Користувачі Quarry мають погодитися з Умовами використання Labs.
Написання і запуск SQL запитів
[ред. код]Вибір бази даних
[ред. код]За замовчуванням Quarry запитує базу даних англомовної Вікіпедії ("enwiki_p"). Ви можете використовувати базу будь якого іншого вікісайту почавши ваш запит рядком USE <dbname>_p;
. Наприклад, наступний SQL запит повертає кількість редагувань зроблених користувачем "Ilya" в українській Вікіпедії із 1 січня 2016 року.
USE ukwiki_p;
SELECT COUNT(*)
FROM revision_userindex
WHERE
rev_user_text = "Ilya" AND
rev_timestamp >= "20160101";
Назва бази даних зазвичай складається із коду мови та вікі-родини (wiki
для Вікіпедії, wikibooks
для Вікіпідручника тощо). Для багатомовних вікі назва бази складається і назви сайту і wiki
, наприклад commonswiki
, wikidatawiki
. Дивіться повний перелік: https://quarry.wmflabs.org/query/278.
Доступні таблиці та колонки
[ред. код]Для огляду наявних таблиць та колонок дивіться Схему бази MediaWiki. Деякі додаткові таблиці розширень також доступні, вони мають бути описані на сторінці документації відповідного розширення. Однак не всі можливі дані доступні. Наступні — ні:
- Таблиця
text
, що містить текст версій статей відсутня. - Приватні дані вилучені.
Також таблиці revision
і logging
не мають індексів на колонках користувачів. Натомість ви можете використати таблиці revision_userindex
і logging_userindex
(дивіться wikitech:Help:Tool_Labs/Database#Tables for revision or logging queries involving user names and IDs)
Щоб отримати повний список таблиці запустіть запит (замініть enwiki_p
на необхідну вам базу даних):
SHOW TABLES FROM enwiki_p;
Для отримання схеми таблиці ви можете використати DESCRIBE
(https://quarry.wmflabs.org/query/585)
DESCRIBE ukwiki_p.page;
Завантаження результату
[ред. код]Quarry дозволяє завантажити результати запиту. Кнопка завантаження одразу перед результатами запиту дозволяє отримати їх у форматах CSV, TSV, JSON та вікі-таблиць. Ви можете також отримати результат програмно із інших інструментів.
- Формат http запиту
https://quarry.wmflabs.org/run/ID_запиту/output/номер_запуску/<csv|json|tsv|wikitable>
- Наприклад
https://quarry.wmflabs.org/run/1534/output/0/json
- Відповідь
{"headers": ["COUNT(*)"], "rows": [[88]]}
Інтервікі посилання
[ред. код]Існує код інтервікі посилання quarry:
для простішого посилання на запити, наприлад.
Дивіться також
[ред. код]- SQL для Вікіпроектів у Вікіпідручнику
- Mediawiki database layout
- Query library -- for ideas of queries to run
- Privacy policy
- Quarry source code
- Quarry bug tracker
- Labs Terms of use
- Tool labs database access documentation