Ґрід

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Ґрід обчислення — це географічно розподілена інфраструктура, яка об'єднує множину різних типів, доступ до яких користувач може отримати з будь-якої точки, незалажено від місця їх розміщення. Ґрід надає колективний розподілений режим доступу до ресурсів і до зв'язаних з ними послугами в рамках глобально-розподілених організацій(підприємства які спільно використовують глобальні ресурси, бази даних, спеціалізоване програмне забезпечення).[1][2] [3]

Ґрід є формою розподілених обчислень, в якому багато комп'ютерів об'єднані в один потужний віртуальний комп'ютер, і які працюють разом для виконання трудомістких завдань. Для певний додатків, "ґрід" обчислення можна розлядати як спеціальний тип паралельних обчислень які покладаються на цілі комп'ютери(обладнані процесорами, пам'ятю, живленням, мережевим інтерфейсом і тд.), під'єднані до комп'ютерної мережі(приватної або публічної) звичайним мережевим інтерфейсом, таким як Ethernet.

Огляд[ред.ред. код]

Ґрід обчислення з'єднує комп'ютери з багатьох адміністративних доменів для досягнення певних цілей,[4] Одніє з основних стратегій ґрід обчислень є використання проміжного ПЗ, яке може адаптуватися під завдання, що розв'язується в одному віртуальному домені, для того щоб розподілити шматки програм серед декількох комп'ютерів, іноді навіть серед тисяч. Ґрід обчислення включає обчислення в розподіленій манері, що може включати використання великих кластерів. Розмір сітки може варіюватися від слабо прикутих до мережі робочих станцій в межах корпорації, до сильно прикутих до мережі комп'ютерних робочих станцій публічної корпорації з багатьма компаніями та мережами.[5]

Координація додатків на Грід системах може бути складним завданням, особливо коли координують потоки інформації через розподілені обчислювальні ресурси. Робочі потоки Ґрід були розроблені як спеціалізована форма систем робочих потоків, зроблених спеціально для того щоб створювати та виконувати серії обчислювальних кроків або кроків маніпуляції з даними, або робочих потоків у контексті Ґрід.

Порівняння Ґрід та звичайних суперкомп'ютерів[ред.ред. код]

“Розподілені” або “ґрід” обчислення загалом є спеціальним типом паралельних обчислень що покладається на цілі комп'ютери(з повною комплектацією), під'єднані до комп'ютерної мережі(приватної або публічної) звичайним мережевим інтерфейсом, в той час як звичайний суперкомп'ютер містить безліч процесорів, підключених до локальної високошвидкісної шини.

Основною перевагою розподілених обчислень є те, що окремий осередок обчислювальної системи може бути придбаний як звичайний неспеціалізований комп'ютер. Таким чином можна отримати практично ті ж обчислювальні потужності, що і на звичайних суперкомп'ютерах, але з набагато меншою вартістю.[6]

Також є певні відмінності у програмуванні та устаткуванні. Писати програми які працюють у середовищі суперкомп'ютера, що може мати унікальну операційну систему, може бути дорого і складно. Якщо проблема може бути адекватно розпаралелена, тонкий шар ґрід інфраструктури може дозволити звичайній програмі запуститись на декількох машинах. Це робить можливим написання та відлагоджування на одній машині, і виключає ускладення через декілька однакових програм запущених одночасно в спільній пам'яті і просторі збереження даних.

Конструктивні міркування і різновиди[ред.ред. код]

Одна особливість розподілених грід систем це те що вони можуть бути сформовані з обчислювальних ресурсів які належать до декількох організацій. (відомих як адміністративні домени). Це може полегшити комерційні транзакції або збірку волонтерських обчислювальних мереєж.

Один недолік цієї особливості це те що комп'ютери які виконують обчислення можуть не заслуговувати довіри. Дизайнери систем повинні забезпечити міри щоб запобігти того що шкідливі програми або збої посприяють виготовленню неправильних, зпоганених результатів, чи використання системи як вектор атаки. Це часто включає назначення роботи випадковому вузлу і перевірку чи хочаб два різні вузли надсилають однакову відповідь щодо даної роботи. Розбіжності відразу покажуть збій у системі або шкідливу програму. Проте, через нехватку централізованого контролю над обладнанням, немає гарантії що вузли не виведуть з ладу всю мережу у будь-який момент.

Публічні системи або адміністративні домени часто результують в потребу запуску на гетерогенних системах, використовуючи різні операційні системи і комп'ютерні архітектури. З багатьма мовами програмування, є компроміс між інвестуванням в програмну розробку та кількість платформ які можуть бути підтримані. Крос-платформені мови можуть знизити потребу цих компромісів, за рахунок високої продуктивності на будь-якому вузлі. Є різноманітні наукові та комерційні проекти для використання певної пов'язаної сітки або для встановлення нових.

Справді, проміжне ПЗ можна розглядати як шар між апаратним та програмним забезпеченням. У верхівці проміжного ПЗ, повинно враховуватись кількість технічних територій, і вони можуть або не можуть бути залежними від проміжного ПЗ. Приклади таких територій включають SLA, довіра та безпека, віртуальні організації, менеджмент ліцензій, менеджмент даних.

Сегментація ринку грід обчислень[ред.ред. код]

Для сегментації ринку розподілених обчислень, повинні бути розглянуті дві перспективи: сторона постачальника і сторона користувача:

Сторона провайдера[ред.ред. код]

В цілому, ринок грід включає декілька специфічних ринків. Такими є ринок проміжного ПЗ грід систем, ринок для грід застосунків, These are the grid middleware market, the market for grid-enabled applications та ринок програма-як-сервіс (SaaS).

Проміжне ПЗ грід систем це специфічний програмний продукт, який включає обмін гетерогенними ресурсами та віртуальні організації. Воно інтегроване в існуючу інфраструктуру певної компанії або компаній, і надає спеціальний шар між інфраструктурою та користувачами. Основним проміжним ПЗ є Globus Toolkit, gLite, та UNICORE.

Грід застосунки це спеціальне програмне забезпечення яке може утилізувати грід інфраструктуру. Це можливо завдяки використання проміжного ПЗ.

Програмне забезпечення як послуга (SaaS) модель пропозиції програмного забезпечення споживачеві, при якій постачальник розробляє веб-застосунок, розміщує його й управляє ним (самостійно або через третіх осіб) з метою та можливістю використання замовниками через інтернет. Замовники платять не за володіння програмним забезпеченням як таким, а за його використання (через API, що доступний через веб і часто використовує веб-служби). Близьким до терміну SaaS є термін «On-Demand» (за запитом).

Сторона користувача[ред.ред. код]

Для компаній на замовлення або для користувацької сторони ринку грід обчислень, відмінні сегменти мають значні наслідки для їх IT стратегії розгортання. Стратегія ІТ розгортання так як і тип ІТ інвестувань є важливими аспектами для понетціальних грід користувачів та відіграють важливу роль для грід.


Історія[ред.ред. код]

Термін «грід-обчислення» з'явився на початку 1990-х років, як метафора, що демонструє можливість простого доступу до обчислювальних ресурсів як і до електричної мережі (англ. Power grid) у збірнику під редакцією Яна Фостера і Карла Кессельман «The Grid: Blueprint for a new computing infrastructure ».

Використання вільного часу процесорів і добровільного комп'ютингу стало популярним в кінці 1990-х років після запуску проектів добровільних обчислень GIMPS в 1996 році, distributed.net в 1997 році і SETI @ home в 1999 році. Ці перші проекти добровільного комп'ютингу використовували потужності приєднаних до мережі комп'ютерів звичайних користувачів для вирішення дослідницьких завдань, що вимагають великих обчислювальних потужностей.

Ідеї грід-системи (включаючи ідеї з областей розподілених обчислень, об'єктно-орієнтованого програмування, використання комп'ютерних кластерів, веб-сервісів та ін.) були зібрані і об'єднані Іеном Фостером, Карлом Кессельманом і Стівом Тікі, яких часто називають батьками грід-технології. Вони почали створення набору інструментів для грід-комп'ютингу Globus Toolkit, який включає не тільки інструменти менеджменту обчислень, але й інструменти управління ресурсами зберігання даних, забезпечення безпеки доступу до даних і до самого грід, моніторингу використання і пересування даних, а також інструментарій для розробки додаткових грід-сервісів. В даний час цей набір інструментарію є де факто стандартом для побудови інфраструктури на базі технології грід, хоча на ринку існує безліч інших інструментаріїв для грід-систем як у масштабі підприємства, так і в глобальному.

Грід-технологія застосовується для моделювання та обробки даних в експериментах на Великому адронному колайдері (грід використовується і в інших завданнях з інтенсивними обчисленнями). На платформі BOINC в даний час ведуться активні обчислення понад 60 проектів. Наприклад, проект Fusion (південь Франції, розробка методу отримання електрики за допомогою термоядерного синтезу на експериментальному реакторі ITER) також використовує грід (EDGeS @ Home). Під назвою CLOUD розпочато проект комерціалізації грід-технологій, в рамках якого невеликі компанії, інститути, які потребують обчислювальних ресурсах, але не можуть собі дозволити з тих чи інших причин мати свій суперкомп'ютерний центр, можуть купувати обчислювальний час гріду.

Найшвидші віртуальні суперкомп'ютери[ред.ред. код]

  • Станом на червень 2014, Bitcoin Network – 1166652 PFLOPS.[7]
  • Станом на квітень 2013, Folding@home – 11.4 x86-еквівалентно (5.8 "рідне") PFLOPS.[8]
  • Станом на березень 2013, BOINC – в середньому 9.2 PFLOPS.[9]
  • Станом на квітень 2010, MilkyWay@Home більше ніж 1.6 PFLOPS, з великою кількістю ресурсів GPU.[10]
  • Станом на квітень 2010, SETI@home в середньому більше 730 TFLOPS.[11]
  • Станом на квітень 2010, Einstein@Home видає більше 210 TFLOPS.[12]
  • Станом на червень 2011, GIMPS витримує 61 TFLOPS.[13]

Проекти та застосунки[ред.ред. код]

Грід обчислення пропонує рішення глобальних завдань, таких як згортання білків, фінансове моделювання, симуляцію землетрусів і моделювання клімату та погоди. Грід пропонує оптимальне використання ресурсів інформаційних технологій всередині організації. Він також надає інформаційні технології як обчислювальні утиліти для комерційних та не комерційних користувачів, котрі платять лише за те що вони використовують, так як з електрикою або з водою.

Станом на серпень 2009 Folding@home досягнув більше ніж 4 petaflops на ~350,000 машинах.

BEinGRID (Business Experiments in Grid) був проектом дослідження фінансований Європейською Комісією[14] як інтеграційний проект під спонсорством Шостої Фреймворк Програми (FP6). Стартувавши 1 Червня 2006, проект пропрацював 42 місяці, до листопада 2009. Проект був координований Atos Origin.

Проект підключення Грід систем для E-sciencE , розташованого в Євросоюзі і включаючого сайти в Азії та США був подальшим проектом для European DataGrid (EDG), котрий еволюціонував в European Grid Infrastructure. Європейська Грід Інфраструктура також була застосована в інший дослідженнях і експериментах таких як симуляція онкологічних клінічних випробувань.[15]

У 2011, більше 6.2 мільйона машин працювали з Berkeley Open Infrastructure for Network Computing (BOINC) платформою, члени якої є члени World Community Grid, яка очолює обчислювальну потужність зі своїм найшвидшим суперкомп'ютером (Китайським Tianhe-I).[16]

Визначення[ред.ред. код]

СЬогодні є багато визначень що таке ґрід обчислення:

  • У своїй статті “What is the Grid? A Three Point Checklist”,[4] Ian Foster описує такі атрибути:
    • Обчислювальні ресурси не адмініструються централізовано.
    • Використані відкриті стандарти.
    • Досягнути нетривіальна якість сервісу.
  • Plaszczak/Wellner[17] визначає грід технологію як "технологія яка включає ресурси віртуалізації, підготовку на вимогу і сервіс(ресурс) спільний між організаціями.
  • IBM визначає ґрід обчислення як "здатність використовувати набір відкритих стандартів і протоколів, щоб отримати доступ до програм та даних, оброблювальних потужностей, ємність і широкий масив інших обчислювальних ресурсів в інтернеті. Грід це тип паралельних та розподілених систем що включає обмін, вибір, агрегацію ресурсів розподілених між багатьма адміністративними доменами, заснованими на їх(ресурсів) доступності, місткості, продуктивності, вартості та якості вимог для користувача."[18]
  • Ранішній приклад поняття обчислень як утиліти був наведений Фернандо Корбато в 1965 році. Корбато та інші дизайнери Multic operating system An earlier example of the notion of computing as utility was in 1965 by MIT's Fernando Corbató. Corbató and the other designers of the Multics operating system бaчили комп'ютерний об'єкт працюючий "як енергетична або водяна компанія".[19]

Див. також[ред.ред. код]

Пов'язані поняття[ред.ред. код]

Союзи та організації[ред.ред. код]

Виробники Ґрід[ред.ред. код]

Інтернаціональні проекти[ред.ред. код]

Назва Регіон Початок Кінець
European Grid Infrastructure (EGI) Європа Травень 2010 Грудень 2014
Open Middleware Infrastructure Institute Europe (OMII-Europe) Європа Травень 2006 Травень 2008
Enabling Grids for E-sciencE (EGEE, EGEE II and EGEE III) Європа Березень 2004 Квітень 2010
Grid enabled Remote Instrumentation with Distributed Control and Computation (GridCC) Європа Вересень 2005 Вересень 2008
European Middleware Initiative (EMI) Європа Травень 2010 активний
KnowARC Європа Червень 2006 Листопад 2009
Nordic Data Grid Facility Скандинавія та Фінляндія Червень 2006 Грудень 2012
World Community Grid Глобальна Листопад 2004 активний
XtreemOS Європа Червень 2006 (Травень 2010) продовж. до Вересня 2010
OurGrid Бразилія Грудень 2004 активний

Національні проекти[ред.ред. код]

Стандарти та програмні інтерфейси[ред.ред. код]

Програмна реалізація та проміжне ПЗ[ред.ред. код]

Фреймворки для моніторингу[ред.ред. код]


Посилання[ред.ред. код]

  1. Grid vs cluster computing
  2. What is grid computing? - Gridcafe. E-sciencecity.org. Retrieved 2013-09-18.
  3. Scale grid computing down to size. NetworkWorld.com. 2003-01-27. Процитовано 2015-04-21. 
  4. а б What is the Grid? A Three Point Checklist. 
  5. Pervasive and Artificial Intelligence Group :: publications [Pervasive and Artificial Intelligence Research Group]. Diuf.unifr.ch. May 18, 2009. Процитовано July 29, 2010. 
  6. Computational problems - Gridcafe. E-sciencecity.org. Retrieved 2013-09-18.
  7. bitcoinwatch.com (15 June 2014). Bitcoin Network Statistics. Bitcoin. Staffordshire University. Процитовано June 15, 2014. 
  8. Pande lab. Client Statistics by OS. Folding@home. Stanford University. Процитовано April 23, 2013. 
  9. BOINCstats – BOINC combined credit overview. Процитовано March 3, 2013. 
  10. MilkyWay@Home Credit overview. BOINC. Процитовано April 21, 2010. 
  11. SETI@Home Credit overview. BOINC. Процитовано April 21, 2010. 
  12. Einstein@Home Credit overview. BOINC. Процитовано April 21, 2010. 
  13. Internet PrimeNet Server Distributed Computing Technology for the Great Internet Mersenne Prime Search. GIMPS. Процитовано June 6, 2011. 
  14. Home page of BEinGRID
  15. Athanaileas, Theodoros, et al. (2011). Exploiting grid technologies for the simulation of clinical trials: the paradigm of in silico radiation oncology. SIMULATION: Transactions of The Society for Modeling and Simulation International 87 (10) (Sage Publications). с. 893–910. doi:10.1177/0037549710375437. 
  16. BOINCstats
  17. P Plaszczak, R Wellner, Grid computing, 2005, Elsevier/Morgan Kaufmann, San Francisco
  18. IBM Solutions Grid for Business Partners: Helping IBM Business Partners to Grid-enable applications for the next phase of e-business on demand
  19. Structure of the Multics Supervisor. Multicians.org. Retrieved 2013-09-18.

Бібліографія[ред.ред. код]

Вихідні посилання[ред.ред. код]