JIT-компіляція

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Just-in-time compilation (JIT) (також відома як dynamic translation або run-time compilation)[1] — компіляція «на льоту» — це технологія збільшення продуктивності програмних систем, що виконують програмний код, шляхом трансляції байт-коду в машинний код безпосередньо під час роботи програми. У такий спосіб досягається висока швидкість виконання за рахунок збільшення споживання пам'яті (для зберігання результатів компіляції) і витрат часу на компіляцію.

JIT компіляція є комбінацією двох основних методів трансляції в машинний код, інтерпретації та статичної компіляції, та наслідує якості обох підходів: переваги швидкості скомпільованого коду та гнучкості інтерпретатора поєднані з накладними витратами інтерпретації та компіляції коду. JIT-компіляція є підвидом динамічної компіляції що дозволяє використання технік адаптивної оптимізації, таких як динамічна рекомпіляція, використання інтерпретатором мікроархітектурних оптимізацій.[2] JIT-компіляція підходить для динамічних мов програмування, оскільки системи компіляції реального часу можуть сконструювати пізньо-зв'язуванні типи даних та гарантувати безпеку.

Застосування[ред. | ред. код]

JIT-компіляція може бути використана у окремих програмах, або для реалізації певного динамічного функціоналу, такого як регулярні вирази. Для прикладу, редактор може скомпілювати регулярний вираз, який був введений під час роботи програми, у швидкий машинний код — цю компіляцію неможливо провести завчасно, оскільки шаблон регулярного виразу вводиться під час виконання. Деякі сучасні середовища виконання покладаються на JIT-компіляцію для підвищення швидкості роботи коду. Прикладами таких середовищ є більшість імплементацій Java та .NET Framework. Схожим чином, багато бібліотек використовують JIT-компіляцію для трансляції регулярних виразів у необхідний байт- або машинний код. JIT компіляція також використовується в деяких емуляторах, з метою трансляції машинного коду процесорів однієї архітектури до машинного коду процесора іншої архітектури.

Звичний JIT-компілятор виконує статичну компіляцію перед виконанням, отримуючи байткод (код віртуальної машини), відомий також як байткод компіляція, а після — виконує компіляцію в машинний код (динамічна компіляція, або JIT-компіляція), замість простого процесу інтерпретації байткоду в машинний код. Це дозволяє покращити швидкість виконання коду (порівняно з інтерпретацією), ціною втрати часу на компіляцію. Трансляція коду JIT-компілятором, так само як і інтерпретатором, є безперервним процесом, проте кешування скомпільованого коду зменшує затримку подальшого виконання повторно використаного коду. Оскільки в цьому випадку компілюється тільки частина програми, затримка на компіляцію перед виконанням є меншою, ніж час компіляції всієї програми.

Історія розвитку JIT-компіляції, її основних підходів[ред. | ред. код]

Найпершим опублікованим JIT-компілятором вважається робота Джона Маккарті над LISP у 1960.[3] В його статті «Recursive functions of symbolic expressions and their computation by machine, Part I» (англ. Рекурсивні функції символічних виразів та їхнє обчислення машинами, Частина 1), він згадує функції, що транслюються під час роботи програми, уникаючи необхідності збереження вихідного коду компілятора на перфокартах.[3] (кращим терміном для описаної системи буде «Система компіляції та запуску» (англ. compile and go system). Іншим раннім застосуванням JIT-компіляції є робота Кена Томпсона, шаблонований пошук текстового редактора QED, в якому використовувалась JIT-компіляція регулярних виразів у машинний код IBM 7094, під керівництвом ОС Compatible Time-Sharing System.[3] Великий вплив мав спосіб отримання машинного коду через інтерпретацію, який був використаний у імплементації експериментальної мови програмування LC² компанією Mitchell у 1970 році.[4][5]

Мова Smalltalk містила в собі новаторські аспекти JIT-компіляції. Наприклад, трансляція машинного коду виконувалась за потребою, а результат компіляції кешувався для подальшого використання. У випадку нестачі пам'яті, система видаляла видаляла частинки цього коду та відновлювала новою компіляцією за потреби.[6][7] Мова Self, «діалект» мови Smalltalk що був розроблений компанією Sun, розвинула ці техніки та певний час була найшвидшою з сімейства Smalltalk, досягаючи половини швидкості оптимізованого коду на C[8], будучи повністю об'єктно-орієнтованою мовою.

Згодом Sun припинили активну розробку Self, однак використали отриманий досвід у мові Java. Термін «Just-in-time компіляція» був запозичений з виробничого терміну «Just in time» та набув популярності у Java — Джеймс Гослінг використовував цей термін з 1993.[9] Зараз JIT-компіляція використовується більшістю імплементацій віртуальної машини Java, оскільки HotSpot бере за основу та активно використовує цю технологію.

Проєкт Dynamo[10] компанії HP був експериментальним JIT-компілятором, в якому формат байткоду відповідав машинному коду, система переводила машинний код PA-6000 у машинний код PA-8000. Це призвело до збільшення швидкодії, у деяких випадках до 30 %, оскільки відкрило можливість використовувати оптимізації на рівні машинного коду, наприклад, вбудовування коду для кращого використання кеш-пам'яті, оптимізації викликів динамічних бібліотек та інші, що доступні тільки під час безпосереднього виконання, що робить їх проблематичними для використання звичайними компіляторами.[11][12]

30 березня 2019 року було анонсовано, що PHP 8 отримає JIT-компіляцію[13] у 2021 році.[14]

Питання безпеки[ред. | ред. код]

JIT-компіляція вимагає більшої уваги до питань безпеки та несе підвищені ризики, оскільки має на меті виконання автогенерованого машинного коду. Скомпільований код зберігається в пам'ять та одразу виконується.

Цей процес відрізняється від виконання заздалегідь скомпільованого машинного коду тим, що у випадку JIT-компіляції процесор має виконувати код з загальної ділянки пам'яті. Це суперечить ідеї захисту виконавчої ділянки пам'яті, за якої виконання машинного коду має бути дозволене тільки з спеціально відмічених ділянок пам'яті, та навпаки — виконання коду з загальної пам'яті заборонене, оскільки це є слабким місцем захисту від зовнішніх втручань. З цієї причини, сегменти пам'яті з кодом, який був скомпільований на льоту, мають бути відмічені як виконавчі сегменти. З міркувань безпеки, виконавча помітка має бути виставлена після запису коду в пам'ять та виставлення помітки тільки для читання (read-only), оскільки одночасний дозвіл на запис та виконання сегменту пам'яті є потенційною небезпекою (див. W^X).[15] Для прикладу, Javascript JIT-компілятор Firefox'а отримав таку імплементацію у версії Firefox 46.[16]

JIT spraying є підвидом експлойта, що використовує JIT-компіляцію як елемент heap spraying атаки, що дозволяє обійти ASLR та захист виконавчого простору, заповнивши купу виконавчим кодом.[17]

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. Languages, Compilers, & Runtime Systems | Computer Science and Engineering at Michigan. Computer Science and Engineering (амер.). Архів оригіналу за 28 жовтня 2020. Процитовано 3 жовтня 2020. 
  2. kexugit. Does the JIT take advantage of my CPU?. docs.microsoft.com (en-us). Архів оригіналу за 19 липня 2020. Процитовано 4 жовтня 2020. 
  3. а б в Aycock, 2003, 2. JIT Compilation Techniques, 2.1 Genesis, p. 98.
  4. Aycock, 2003, 2. JIT Compilation Techniques, 2.2 LC², p. 98–99.
  5. Mitchell, J.G. (1970). The design and construction of flexible and efficient interactive programming systems. 
  6. Aycock, 2003.
  7. Deutsch, L.P.; Schiffman, A.M. (1984). Efficient implementation of the Smalltalk-80 system. POPL '84: Proceedings of the 11th ACM SIGACT-SIGPLAN Symposium on Principles of Programming Languages: 297–302. doi:10.1145/800017.800542. ISBN 0-89791-125-3. Архів оригіналу за 18 червня 2004. 
  8. [1] [Архівовано 24 листопада 2006 у Wayback Machine.]
  9. Aycock, 2003, 2.14 Java, p. 107, footnote 13.
  10. «Dynamo: A Transparent Dynamic Optimization System» [Архівовано 2 червня 2012 у Wayback Machine.] Vasanth Bala, Evelyn Duesterwald, Sanjeev Banerjia — PLDI '00 Proceedings of the ACM SIGPLAN 2000 conference on Programming language design and implementation — pages 1 to 12 — DOI:10.1145/349299.349303. Retrieved March 28, 2012
  11. John Jannotti. HP's Dynamo - Page 1 - (3/2000). Ars Technica. Архів оригіналу за 5 лютого 2012. Процитовано 5 липня 2013. 
  12. The HP Dynamo Project. Архів оригіналу за 19 жовтня 2002. Процитовано 12 квітня 2016. {{cite web}}: Обслуговування CS1:Сторінки з посиланнями на джерела, що мають непридатні URL (посилання)
  13. PHP Gr8. Архів оригіналу за 23 лютого 2020. Процитовано 16 жовтня 2020. 
  14. PHP 8 and 7.4 to come with Just-in-time (JIT) to make most CPU-intensive workloads run significantly faster. April 2019. Архів оригіналу за 7 жовтня 2020. Процитовано 16 жовтня 2020. 
  15. «How to JIT — an introduction [Архівовано 17 березня 2019 у Wayback Machine.]», Eli Bendersky, November 5th, 2013 at 5:59 am
  16. De Mooij, Jan. W^X JIT-код у Firefox. Jan De Mooij. Архів оригіналу за 14 травня 2016. Процитовано 11 травня 2016. 
  17. Jürgen Schmidt (20 січня 2011). Return of the sprayer -- JIT Spraying: Exploits to beat DEP and ASLR. The H. Архів оригіналу за 23 січня 2011. Процитовано 22 січня 2011. 

Джерела[ред. | ред. код]