Банк даних білків

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Банк даних білків (англ. Protein Data Bank, PDB) — сховище для тривимірних структурних даних білків і нуклеїнивих кислот. Ці дани, зазвичай отримані методами рентгеноструктурного аналізу і ЯМР-спектроскопії, представляється біологами і біохіміками зі всього світу, знаходяться у публічному домені і можуть використовуватися безкоштовно.

Історія та організація[ред.ред. код]

Банк даних білків був заснований в 1971 році Едгаром Меєром і Волтером Гамільтоном, співробітниками Брукгевенської національнрї лабораторії. В 1998 році управління Банком даних було передане Дослідницькій колаборації структурної біоінформатики (англ. Research Collaboratory for Structural Bioinformatics, RCSB). Адміністрація організації знаходиться на території Університету Ратджерс, її керівником є зараз є Елен Берман[1].

Міжнародна організація Всесвітній Банк даних білків (англ. Worldwide Protein Data Bank, wwPDB) складається з організацій по всьому світу, що займаються внесенням даних до бази даних та розповюдженням накопленої інформації — даних PDB. Членами організації зараз є RCSB PDB (США), PDBe (Європа) і PDBj (Японія). Група BMRB (США) приєдналася до wwPDB в 2006 році. Місією wwPDB є підтримка єдиного архіву даних всіх структур біологічних макрмолекул та вільне розповсюдження цієї інформації.

Крім того, організацією підтримуються та приводяться до спільного формату багато інших баз даних, що містять інформацію щодо функції білків та їх еволюції.

Коли база даних була заснована, вона містила структури 7 білків. З цього часу число структур швидко і майже експоненціально зростає. Сам факт цього росту став предметом окремих досліджень та аналізу growth rate.

Дані[ред.ред. код]

Станом на 26 вересня 2006 року, база даних містила 39 051 тривимірних структур з атомною роздільною здатністю, з них 35 767 структур білків, решта — структури нуклеїнових кислот, нуклеопротеїнів та кількох інших молекул. Зараз щороку додається біля 5 тис. структур. Дані зберігаються в форматі mmCIF, розробленому спеціально для цієї цілі.

Проте, жодна з структур не містить точного розташування всіх атомів великих біомолекул, хоча, за виключенням атомів водню, ці координати можуть бути отримані з великим ступенем достовірності. Дані про послідовності (амінокислот або нуклеотидів) не зберігаються в цій базі, ці дані зберігають в значно більших базах даних, таких як Міжнародна колаборація баз даних послідовностей (англ. International Nucleotide Sequence Database Collaboration) або Swiss-Prot.

станом на 11 вересня 2007 року, «Спосок даних PDB» на сайті RCSB містив наступну статистику:

Білки Нуклеїнові кислоти Нуклеопротеїни Інше Всього
Рентгеноструктурний аналіз 36223 983 1684 24 38914
ЯМР-спектроскопія 5665 781 134 7 6587
Електронна мікроскопія 105 10 38 0 153
Інші методи 80 4 4 2 90
Всього 42073 1778 1860 33 45744

Відмітьте, що теоретичні моделі більше не приймаються до PDB.

22461 стркутури в PDB мають файл структурного фактору. 3138 структури в PDB мають файл даних ЯМР. Сучасний стан бази щотижня оновлюється на сайті [1].

Формат даних[ред.ред. код]

За роки існування, Формат файлів PDB пройшов через числені зміни. Оригінальний формат диктувався шириною комп'ютерних перфокарт.

  • Опис формату — складений співробітниками PDB в BNL (англ.) — тут можуть бути знайдені специфікації формати, це перший сайт, який слід відвідати перед просмотром даних.
  • PDBML (англ.) — представлення даних PDB в форматі XML.
  • ftp.rcsb.org (англ.) — Необроблені дані можуть бути скачані з цьгого сайту.
  • [2] (англ.) — Файли формату PDB можуть бути ортимані через HTTP з цього сайту.
  • http://www.pdb.org/pdb/files/4hhb.xml.gz (англ.) — Файли формату PDBML (XML) можуть бути ортимані через HTTP з цього сайту.
  • ftp.ebi.ac.uk/pub/databases/rcsb/ (англ.) — Альтернативне розташування архіву PDB.
  • www.pdb.org (англ.) — Статистика PDB.

Застарілі формати викликають багато проблем, тому створені проекти переводу даних:

MMDB використовує ASN.1 (та перевод цього формату в XML). Члени wwPDB — RCSB PDB, MSD-EBI і PDBj спільно працюють над створенням єдиного формату в усьому архіві. Хоча дехто сумнівається в доцільності, інші стверджують, що без цього багато даних можуть бути важкими для використання.

Кожна структура в PDB отримує чотирьохбуквений ідентифікатор, PDB ID. Ці дані не слід використовувати для ідентифікації молекули, тому що часто одна молекула має кілька структур в базі даних (отриманих за різними умовами та в різних конформаціах), які мають різні ідентифікатори.

Коли структура портапляє до бази даних, співробітники wwPDB перевіряють та аннотують її. До бази подіються тількі експериментальні, але не теоретично передбачені структури.

Зараз багато фондів, що фінансують дослідження, та наукових журналів вимагають обов'язкової подачі даних до PDB.

Використання даних[ред.ред. код]

Структурні дані можуть бути візуалызовані за допомогою багатьох програм, таких як VMD, RasMol, PyMOL, Jmol, MDL Chime, QuteMol, плагінів для браузерів VRML та STING, програми для настільних комп'ютерів Sirius. Веб-сайт RCSB PDB містить багато посилань на такі програми для використання для освіти, структурної геноміки та інших цілей.

Посилання[ред.ред. код]

Джерела[ред.ред. код]

Друковані[ред.ред. код]

  • H.M. Berman, K. Henrick, H. Nakamura (2003): Announcing the worldwide Protein Data Bank. Nature Structural Biology 10 (12), p. 980 PMID 14634627.
  • H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne: The Protein Data Bank. Nucleic Acids Research, 28 pp. 235—242 (2000). PMID 10592235
  • Bernstein FC, Koetzle TF, Williams GJ, Meyer Jr EF, Brice MD, Rodgers JR, Kennard O, Shimanouchi T, Tasumi M. The Protein Data Bank: a computer-based archival file for macromolecular structures. J Mol Biol 1977;112:535-542. PMID 875032.
  • E.F. Meyer «The First Years of the Protein Data Bank», Protein Science 6:1591-1597 (1997)
  • Sussman, JL, Lin, D, Jiang, J, Manning, NO, Prilusky, J, Ritter, O & Abola, EE. Protein data bank (PDB): a database of 3D structural information of biological macromolecules. Acta Cryst 1998; D54:1078-1084. PMID 10089483.

Онлайн[ред.ред. код]

Інші посилання[ред.ред. код]

Посилання на бази даних ферментів[ред.ред. код]

  • [3] на сайті групи Кіма Гендріка (Kim Henrick) в EBI, частини MSD. ініціатива SIFTS.
  • [4] PDB.
  • [5] Пошук на сайті бази даних ферментів BRENDA.
  • [6] PDBSProtEC:

Інструменти для візуалізації молекул[ред.ред. код]

  • PyMOL — PyMol (англ.) — головна сторінка
  • Sirius — Sirius (англ.) — головна сторінка
  • STING (англ.) — головна сторінка
  • RasMol — RasMol (англ.) — головна сторінка
  • Garlic (англ.) — головна сторінка
  • Swiss-PDB Viewer (англ.) — головна сторінка
  • Jmol Viewer (англ.) — головна сторінка, відкритий код, Java
  • QuteMol — QuteMol Home Page (англ.) — головна сторінка, відкритий код, Windows і Mac
  • StarBiochem (англ.) — головна сторінка, Java, інтегрований пошук в PDB