Контекстно-вільна граматика

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Контекстно-вільна граматика (скорочено КВ граматика) — формальна граматика типу 2 в ієрархії Чомскі.

Визначення[ред.ред. код]

Контекстно-вільна граматика це четвірка :

  • та скінченні множини, що не перетинаються
  • скінченна підмножина

При цьому, використовують такі назви:  — множина нетермінальних символів,  — множина термінальних символів,  — множина правил виводу початковий символ. Правила записують як .

В лівій частині правила виводу має знаходитись одна змінна (нетермінальний символ). Формально, має виконуватись , wobei .

Розширенням КВ-граматик є стохастичні КВ граматики. Правилам виведення співставляють ймовірність використання: де

Нормальні форми[ред.ред. код]

Для КВ граматик визначено різні нормальні форми. В нормальних формах Чомскі (НФЧ) скорочуюють праву частину правил виводу, тобто, права частина може складатись або з одного термінального символу, або з двох нетермінальних. Якщо в лівій частині знаходиться початковий символ, права частина може породжувати порожнє слово. Існує алгоритм, який переводить довільну КВ граматику в НФЧ.

Контекстно-вільна граматика визначена в нормальній формі Грейбах (НФГ), якщо вона не породжує порожнього слова та в права частина правил виводу починається з щонайбільше одного термінального символу, слід за яким йдуть нетермінальні символи. Кожна КВ граматика, яка не породжує порожнє слово, може бути перетворена в НФГ алгоритмом.

Породжена мова[ред.ред. код]

Контекстно-вільні граматики породжують контекстно-вільні мови, тобто, кожна КВ граматика породжує КВ мову, і для кожної КВ мови існує КВ граматика, що її породжує.

Контекстно-вільну мову , породжену КВ граматикою позначають , де:

Символом позначають послідовність правил виводу граматики , в результаті застосування якої отримують слово мови . Також .

Контекстно-вільні мови можна розпізнати недетермінованим автоматом з магазинною пам'ятю. За умови існування детермінованого автомату, здатного розпізнати мову, її називають детермінованою КВ мовою. Ця підмножина КВ мов утворює теоретичну основу для синтаксиса багатьох мов програмування.

Контекстно-вільні мови можуть містити порожнє слово, наприклад, через правило виводу .

Властивості[ред.ред. код]

Приналежність слова[ред.ред. код]

Задача визначення приналежності слова КВ мові, або визначення можливості породження слова КВ граматикою алгоритмічно розв'язна.[1] Під час розв'язання цієї задачі можна побудувати дерево виводу. Його також називають деревом синтаксичного аналізу, а програму, яка його будує — синтаксичним аналізатором. Для кожної КВ граматики можна автоматично побудувати синтаксичний аналізатор (див. також генератор синтаксичних аналізаторів та CYK-алгоритм). Часова складність для найгіршого випадку синтаксичного аналізу довільної КВ граматики знаходиться на рівні O. Для детермінованих КВ граматик можна побудувати синтаксичний аналізатор, час роботи якого знаходиться на рівні . Типовим прикладом застосування ефективних синтаксичних аналізаторів з лінійним часом роботи є синтаксичний аналіз вихідних текстів програм в компіляторі.

Якщо слово мови L () в граматиці може бути отримане декілька різними способами, то таку граматику називають багатозначною. Синтаксичний аналізатор для багатозначної граматики може побудувати декілька різних дерев синтаксичного аналізу. Багатозначність не важлива для розв'язання задачі належності слова, але якщо різним деревам співставляють різне значення, то один й той самий текст може мати різні значення. Наприклад, однозначність граматики важлива для процесу компіляції, аби отримати правильний код.

Багатозначність[ред.ред. код]

Задача розпізнавання багатозначності серед КВ граматик алгоритмічно не розв'язна.[2]. Однак існують способи перевірки на багтозначність або однозначність для деяких окремих випадків КВ граматик[3].

Еквівалентність[ред.ред. код]

Задача визначення еквівалентності граматик та , або породження ідентичних мов алгоритмічно нерозв'язна.[4]

Підмножина[ред.ред. код]

Задача визначення чи породжена КВ граматикою мова також може бути породжена іншою КВ граматикою , тобто, чи алгоритмічно нерозв'язна.[5]

Об'єднання[ред.ред. код]

Об'єднання двох КВ граматик () також КВ граматика. Тобто, .

Перетин[ред.ред. код]

Задача визначення приналежності перетину двох КВ граматик до класу КВ граматик алгоритмчно не розв'язувана.[6]

Доповнення[ред.ред. код]

Доповнення КВ граматики не контекстно-вільне.

Приклади[ред.ред. код]

Нехай  — КВ граматика

складається з чотирьох правил виводу:

в граматиці можна отримати наступною послідовністю застосування правил виводу:

тут  — дерево виведення. Корінь дерева та проміжні вузли позначені нетермінальними символами, а листи дерева позначені термінальними символами.

Таким чином, .

Слово де не належить до мови , оскільки нетермінальний символ не початковий, а всі слова утворені від початкового мають знаходитись посеред термінальних та . Формально це записують:

Граматика не багатозначна.

Приклад багатозначності[ред.ред. код]

Як приклад багатозначної граматики можна навести: .

містить такі правила виводу:

До можна застосувати правила , та . Таким чином  — багатозначна.

Див. також[ред.ред. код]

Посилання[ред.ред. код]

  1. Schöning, 2001, S.21
  2. Alfred V. Aho and Jeffrey D. Ullman The Theory of Parsing, Translation, and Compiling. Volume 1: Parsing. — Prentice-Hall, 1972. — ISBN 0-13-914556-7.
  3. H. J. S. Basten Ambiguity Detection Methods for Context-Free Grammars.
  4. Schöning, 2001, S.137
  5. Schöning, 2001, S.137
  6. Schöning, 2001, S.137

Література[ред.ред. код]

  • Uwe Schöning Theoretische Informatik - kurzgefasst. — 4.. — Spektrum Akademischer Verlag, 2001. — С. 13, 51. — ISBN 3-8274-1099-1.