SQL

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
SQL
декларативна мова програмування, мова запитів і формат файлу
Парадигма: мульти-парадигмовий
Дата появи: 1974
Творці: Дональд Чамберлін та Раймонд Бойс
Розробник: IBM
Останній реліз: SQL:2008 (2008)
Система типізації: строга статична типізація
Основні реалізації: багато
Діалекти: SQL-86, SQL-89, SQL-92, SQL:1999, SQL:2003, SQL:2006, SQL:2008[1]
Під впливом від: Datalog
Вплинула на: CQL, LINQ, Windows PowerShell
ОС: крос-платформова
Звичайні розширення файлів: sql
Just Solve the File Format Problem SQL

SQL (англ. Structured query language — мова структурованих запитів) — декларативна мова програмування для взаємодії користувача з базами даних, що застосовується для формування запитів, оновлення і керування реляційними БД, створення схеми бази даних та її модифікації, системи контролю за доступом до бази даних. Сама по собі SQL не є ані системою керування базами даних, ані окремим програмним продуктом. На відміну від дійсних мов програмування(C або Pascal), SQL може формувати інтерактивні запити або, бувши вбудованою в прикладні програми, виступати як інструкції для керування даними. Окрім цього, стандарт SQL містить функції для визначення зміни, перевірки та захисту даних.

SQL — це діалогова мова програмування для здійснення запиту і внесення змін до бази даних, а також керування базами даних. Багато баз даних підтримує SQL з розширеннями до стандартної мови. Ядро SQL формує командна мова, яка дозволяє здійснювати пошук, вставку, оновлення і вилучення даних за допомогою використання системи керування і адміністративних функцій. SQL також включає CLI (Call Level Interface) для доступу і керування базами даних дистанційно.

Перша версія SQL була розроблена на початку 1970-х років у IBM. Ця версія мала назву SEQUEL і була призначена для обробки та пошуку даних, що містилися в реляційній базі даних IBM, System R. Мова SQL надалі була стандартизована Американськими Держстандартами (ANSI) в 1986. На початку SQL була запланована як мова запитів і управління даними, а пізніші модифікації SQL створені продавцями системи управління базами даних, які додали процедурні конструкції, control-of-flow команд і розширення мов. З випуском стандарту SQL:1999 такі розширення були формально запозичені як частина мови SQL через Persistent Stored Modules (SQL/PSM).

Критика SQL включає відсутність крос-платформенності, невідповідну обробку відсутніх даних (дивіться Null (SQL)). Часто це неоднозначна граматика і семантика мови.

Історія[ред.ред. код]

На початку 1970-х років в одній з дослідницьких лабораторій компанії IBM була розроблена експериментальна реляційна СУБД System R, для якої потім була створена спеціальна мова SEQUEL, що дозволяла відносно просто керувати даними в цій СУБД. Абревіатура SEQUEL розшифровувалася як англ. Structured English QUEry Language — «структурована англійська мова запитів». Пізніше з юридичних міркувань[2] мова SEQUEL була перейменована в SQL. Коли в 1986 році перший стандарт мови SQL був прийнятий ANSI (American National Standards Institute), офіційною вимовою стало [,es kju:' el] — ес-к'ю-ел. Попри це, навіть англомовні фахівці по традиції часто називають SQL "сіквел", замість "ес-кью-ел".

Метою розробки було створення простої непроцедурної мови, якою зміг би скористатися будь-який користувач, що навіть не має навичок програмування. Власне розробкою мови запитів займалися Дональд Чемберлін (Donald D. Chamberlin) та Рей Бойс (Ray Boyce). Пет Селінджер (Pat Selinger) займалася розробкою вартісного оптимізатора (англ. cost-based optimizer), Реймонд Лорі (Raymond Lorie) займався компілятором запитів.

Варто зазначити, що SEQUEL не була єдиною мовою подібного призначення. У Каліфорнійському університеті в Берклі була розроблена некомерційна СУБД Ingres (що була, між іншим, дальнім прародичем популярної зараз некомерційної СУБД PostgreSQL), яка була реляційною СУБД, але використовувала свою власну мову QUEL, яка, проте, не витримала конкуренції за кількістю СУБД, що підтримували її, з мовою SQL.

Першими СУБД, що підтримують нову мову SQL1979 року), стали Oracle V2 для машин VAX від компанії Relational Software Inc. (що згодом стала компанією Oracle) і System/38 від IBM, заснована на System/R.

Перший офіційний стандарт мови SQL був прийнятий ANSI в 1986 і ISO (Міжнародною організацією зі стандартизації) в 1987 (так званий SQL-86), який був уточнений в 1989 році. Наступний розвиток мови постачальниками СУБД зажадав ухвалення в 1992 р. нового розширеного стандарту (ANSI SQL-92, або просто SQL2). Наступним стандартом став SQL:1999 (SQL3). В наш час[Коли?], діє стандарт, який був прийнятий у 2003 році (SQL:2003), а надалі зазнав незначними модифікацій.

Стандарти[ред.ред. код]

Повністю історія версій стандартів-ревізій SQL:

Рік Назва Інша назва Коментар
1986 SQL-86 SQL-87 Вперше оприлюднено ANSI. Ратифіковано ISO в 1987.
1989 SQL-89 FIPS 127-1 Незначні зміни.
1992 SQL-92 SQL2 Вагомі зміни.
1999 SQL:1999 SQL3 Додано регулярні вирази, рекурсивні запити, тригери та деякі об'єктно-орієнтовані нововведення.
2003 SQL:2003 SQL 2003 Впроваджені розширення для роботи з XML-даними.
2006 SQL:2006 SQL 2006 ISO/IEC 9075-14:2006. Функціональність роботи з XML-даними значно розширено. З'явилась можливісь сумісного використання в SQL та XQuery.
2008 SQL:2008 SQL 2008 Вдосконалені можливості віконних функцій, усунуто деякі неоднозначності стандарту SQL:2003. Легалізовано ORDER BY поза визначенням курсору. Додано тригери INSTEAD OF. Додано заяви TRUNCATE.
2011 SQL:2011 SQL 2011 ISO/IEC 9075:2011.

Синтаксис[ред.ред. код]

Докладніше: Синтаксис SQL

Мова SQL поділяється на кілька видів елементів:

  • Пункти (диз'юнкти) (англ. Clauses), що є складовими частинами інструкцій та запитів. (Іноді вони не обов'язкові.)[3]
  • Вирази (англ. Expressions), які можуть генерувати скалярні значення, або таблиці з стовпчиками і рядками даних
  • Предикати (англ. Predicates), які описують умови, результатом яких є значення тризначної логіки SQL (true/false/unknown) або Булеві значення істинності і які використовуються для обмеження ефекту інструкцій та запитів, або для зміни потоку виконання програми.
  • Запити (англ. Queries), які отримують дані на основі заданих критеріїв.
  • Інструкції (англ. Statements), які чинять дію на схему даних чи самі дані, або контролюють транзакції, потік виконання програми, з'єднання, сесії, та виконують діагностику.
    • Інструкції SQL також включають крапку з комою (";") для позначення кінця інструкції. Хоча вона не є обов'язковою на кожній платформі, вона описується як стандартна частина граматики SQL.
  • Незначимі пропуски загалом ігноруюються в інструкціях і запитах SQL, дозволяючи форматувати код SQL з метою покращення читабельності.

Структура SQL[ред.ред. код]

SQL (Structured query language — мова структурованих запитів), складається з:

Data Definition Language[ред.ред. код]

Докладніше: DDL
  • CREATE — створення об'єкта (наприклад, таблиці);
  • ALTER — зміна об'єкта (наприклад, додавання/зміна полів таблиці);
  • DROP — видалення об'єкта.

Data Manipulation Language[ред.ред. код]

Докладніше: DML
  • INSERT — вставлення рядочка;
  • SELECT — вибірка;
  • UPDATE — зміна;
  • DELETE — видалення.

Data Control Language[ред.ред. код]

Докладніше: DCL
  • GRANT — надання прав користувачу;
  • DENY — явна заборона для користувача;
  • REVOKE — відміна заборони/дозволу користувачу.

Transaction Control Language[ред.ред. код]

Докладніше: Transaction Control Language
  • BEGIN TRANSACTION — почати транзакцію;
  • COMMIT — прийняти зміни прийняті в транзакції;
  • ROLLBACK — відкат.

Питання сумісності[ред.ред. код]

Як і з багатьма стандартами, що мають місце в IT-індустрії, з мовою SQL виникла проблема, пов'язана з рішенням багатьох розробників ПЗ з використанням SQL про недостатню функціональність версії стандарту (що, в принципі, для ранніх версій SQL було певною мірою справедливо) і їхнім бажанням її розширити. Це призвело до того, що у різних виробників СУБД в застосуванні різні діалекти SQL, причому, несумісні між собою у більшості випадків.

До 1996 року питаннями відповідності комерційних реалізацій SQL стандарту займався переважно інститут NIST, який і встановлював рівень відповідності стандарту. Відтоді, як останній підрозділ, що займався СУБД, був розформований, всі зусилля з перевірки СУБД на відповідність стандарту були покладені на її виробника.

Вперше поняття «Рівня відповідності» було запропоноване в стандарті SQL-92. ANSI і NIST визначали чотири рівні відповідності реалізації цьому стандарту:

  • Entry (базовий)
  • Transitional (перехідний) — перевірку на відповідність цьому рівню проводив тільки інститут NIST
  • Intermediate (проміжний)
  • Full (повний)

Легко можна зрозуміти, що кожен наступний рівень відповідності свідомо передбачав відповідність попередньому рівню. Далі, згідно з цими рівнями стандартів, будь-яка СУБД, що відповідала рівню Entry, могла бути охарактеризована як «SQL-92-відповідна», хоча насправді її здатність до перенесення і відповідность стандарту обмежувалися набором можливостей, що входять до вказаного рівня.

Положення змінилося з введенням стандарту SQL:1999. Відтепер стандарт придбав модульну структуру — основна частина стандарту була винесена в розділ «SQL/Foundation», а все інше було виведене в окремі модулі. Залишився лише один рівень сумісності — Core. Підтримка решти можливостей залишена на розсуд виробників СУБД. Аналогічне положення мало місце і з наступними версіями стандарту.

Переваги[ред.ред. код]

Незалежність від конкретної СУБД[ред.ред. код]

Не зважаючи на наявність діалектів і відмінностей в синтаксисі, більшість текстів SQL-запитів, що містять, DDL і DML, можуть бути досить легко перенесені з однієї СУБД в іншу. Існують системи, розробники яких спочатку орієнтувалися на застосування щонайменше кількох СУБД (наприклад: система електронного документообігу Documentum може працювати як з Oracle, так і з Microsoft SQL Server та IBM DB2). Природно, що при застосуванні деяких специфічних для реалізації можливостей, такого рівня перенесення дуже важко досягти.

Наявність стандартів[ред.ред. код]

Наявність стандартів і наборів тестів для виявлення сумісності та відповідності конкретній реалізації SQL загальноприйнятому стандарту тільки сприяє «стабілізації» мови. Щоправда, слід звернути увагу на той факт, що сам по собі стандарт місцями занадто формалізований і має завеликі розміри, наприклад, Core-частина стандарту SQL:2003 містить понад 1300 сторінок тексту.

Декларативність[ред.ред. код]

За допомогою SQL програміст описує лише дані, які потрібно витягнути або модифікувати. Те, яким чином це зробити, вирішує СУБД безпосередньо при обробці SQL-запиту. Не слід вважати, що це повністю універсальний принцип — програміст описує набір даних для вибірки або модифікації, проте йому при цьому корисно уявляти, як СУБД інтерпретуватиме текст його запиту. Такі моменти стають особливо критичними при роботі з великими базами даних та зі складними запитами — чим складніше сконструйований запит, тим більше варіантів написання (різних за швидкістю виконання, але тих самих за набором даних) він припускає.

Недоліки[ред.ред. код]

Невідповідність реляційної моделі даних[ред.ред. код]

Творець реляційної моделі даних Едгар Кодд, Крістофер Дейт та їхні прихильники вказують на те, що SQL не є істинно реляційною мовою. Зокрема, вони привертають увагу до таких проблем SQL[4]:

  • Рядки, що повторюються
  • Невизначені значення (null)
  • Явна вказівка порядку стовпчиків зліва направо
  • Стовпчики без імені та імена стовпчиків, що дублюються
  • Відсутність підтримки властивості «=»
  • Використання вказівників
  • Значна надлишковість

В опублікованому Крістофером Дейтом і Г'ю Дарвеном Третьому Маніфесті[5], вони декларують принципи СУБД наступного покоління та пропонують мову Tutorial D, яка є достовірно реляційною.

Складність[ред.ред. код]

Хоча мову SQL було початково заплановано як засіб роботи кінцевого користувача, врешті-решт вона стала настільки складною, що перетворилася на інструмент програміста.

Відступи від стандартів[ред.ред. код]

Не зважаючи на наявність міжнародного стандарту ANSI SQL-92, багато компаній, що займаються розробкою СУБД (наприклад, Oracle, Sybase, Microsoft, MySQL), вносять зміни до мови SQL, вживаної в розроблених ними СУБД. Цим вони створюють передумови відступу від стандарту. Завдяки такій діяльності для кожної конкретної СУБД з'являються специфічні діалекти мови SQL.

Складність роботи з ієрархічними структурами[ред.ред. код]

Раніше SQL не пропонувала стандартного способу маніпуляції деревовидними структурами. Деякі постачальники СУБД запропонували свої рішення. Для прикладу, Oracle використовує вираз CONNECT BY. В наш час[Коли?] як стандарт прийнята рекурсивна конструкція WITH.

Процедурні розширення[ред.ред. код]

Оскільки SQL не є мовою програмування (тобто не надає засобів для автоматизації операцій з даними), нововведення різних виробників стосувалися в першу чергу процедурних розширень. Це збережені процедури (англ. stored procedures) і процедурні мови - «надбудови». Практично в кожній СУБД застосовується своя процедурна мова. Подібні мови для найпопулярніших СУБД приведені в наступній таблиці.

СУБД Коротка назва Розшифрування
Borland InterBase/
Firebird
PSQL Procedural SQL
IBM DB2 SQL PL SQL Procedural Language (розширює SQL/PSM)
Microsoft SQL Server/
Sybase ASE
Transact-SQL Transact-SQL
MySQL SQL/PSM SQL/Persistent Stored Module
Oracle PL/SQL Procedural Language/SQL (заснований на мові Ada)
PostgreSQL PL/pgSQL Procedural Language/PostgreSQL Structured Query Language (схожий на Oracle PL/SQL)

Простий приклад[ред.ред. код]

Простий запит для виведення списку із атрибутами Name, Address, Class із таблиці School у певній базі даних має такий вигляд:

select Name, Address, Class
from School;

Примітки[ред.ред. код]

  1. http://archives.postgresql.org/pgsql-hackers/2008-09/msg00071.php
  2. «„SEQUEL“ був торговою маркою британської авіабудівної групи компаній Hawker Siddeley» // Andy Oppel. Databases Demystified. — San Francisco, CA : McGraw-Hill Osborne Media. — С. 90—91. — ISBN 0-07-225364-9.
  3. ANSI/ISO/IEC International Standard (IS).
  4. O'Reilly Network. An Interview with Chris Date
  5. The Third Manifesto

Див. також[ред.ред. код]