ChEMBL

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

ChEMBL або ChEMBLdb — це ручна курирувана база хімічних молекул з біоактивними  властивостями.[1] Вона підтримується Європейським Інститутом Біоінформатики[en] (EBI), Європейською Лабораторією Молекулярної Біології[en] (EMBL), розташовується у Wellcome Trust Genome Campus[en], Хінкстон, Велика Британія.

База даних спочатку була відомою як StARlite, була розробленою біотехнологічною компанією під назвою Inpharmatica Ltd. пізніше була придбана компанією Galapagos NV[en]. Дані було придбано для EMBL у 2008 році завдяки премії від «Веллком Траст», внаслідок чого була створена група ChEMBL хемогломерів в EMBL-EBI під керівництвом Джона Олінгтона.[2][3]

Сфера застосування та доступ[ред. | ред. код]

База даних ChEMBL містить дані біологічної активності речовин по відношенню до лікарських цілей. Біоактивності повідомляються у даних Ki, Kd, IC50 і EC50.[4] Дані можуть бути відфільтровані і проаналізовані для розробки бібліотек речовин для скрінінгу, щоб провести ідентифікацію під час відкриття лікарських препаратів.[5]

У січні 2010 року запустили другу версію бази даних ChEMBL (ChEMBL_02), яка також включала 2,4 мільйони вимірювань біотестувань, які охоплюють 622824 сполук, в тому числі 24 тисячі природних продуктів. Ця інформація була отримана від аналізу понад 34000 публікацій із понад дванадцяти жірналів лікарської хімії. Охоплення ChEMBL доступними даними біологічних активностей стає «найповнішою із коли-небудь бачених публічних баз даних».[2] У жовтні 2010 року була запущена  восьма версія баз даних ChEMBL (ChEMBL_08), яка містила 2,97 мільйони вимірювань біотестувань, які охоплюють 636,269 сполук.[6]

У ChEMBL_10 було додано підтверджуючі аналізи PubChem, для того, щоб інтегрувати дані, порівнюючи з типом і класом даних, що містяться в даних ChEMBL.[7]

Доступ до ChEMBLdb можна отримати через вебінтерфейс або завантажити по FTP. Він відформатований таким чином, щоб піддатися комп'ютеризованій обробці даних, і намагається стандартизувати роботу між різними виданнями, щоб виконати порівняльний аналіз.[1] До бази даних ChEMBL також інтегровані інші масштабні хімічні ресурси, у тому числі PubChem, і система ChemSpider від Королівського хімічного товариства.

Споріднені ресурси[ред. | ред. код]

На додаток до бази даних, група ChEMBL розробили також інструменти та ресурси для пошуку даних.[8] Це також включає Кіназа SARfari, інтегрований хемогенетичний робочий інструмент спеціалізований на кіназах. Система включає і поєднує послідовність, структуру, речовини та відбір даних.

GPCR SARfari подібний робочий інструмент спеціалізований на рецепторах gpcr, і ChEMBL-NTD (бази даних ChEMBL-Neglected Tropical Diseases — Забуті тропічні хвороби) — це відкритий репозитарій первинного скринінгу та даних медичної хімії, орієнтованих на ендемічні тропічні хвороби в регіонах Африки, Азії, Північної та Південної Америки. Основна мета даних ChEMBL-NTD є надання вільного доступу і постійний архів та центр розповсюдження даних, які зберігаються.[2]

У липні 2012 року відбулася презентація нової служби даних з малярії, завдяки спонсорській допомозі від проекту Medicines for Malaria Venture (ММВ [Архівовано 3 жовтня 2020 у Wayback Machine.]), призначена для дослідників по всьому світу. Дані цієї служби включають речовини з набору Malaria Box, а також інших пожертвуваних даних по малярії, які містяться в базі даних ChEMBL-NTD.

myChEMBL [Архівовано 10 червня 2015 у Wayback Machine.] — це віртуальна машина бази даних ChEMBL, цей ресурс було представлено у жовтні 2013 року, щоб надати користувачам доступ до повної та безкоштовної, простої в установці інфраструктури хемоінформатики.

В грудні 2013 року, операції бази патентної інформатики SureChem були передані EMBL-EBI. Пакет даних SureChem були перейменовані на SureChEMBL.

У 2014 було введено новий ресурсу ADME SARfari — інструмент для прогнозування та порівняння міжвидових цілей ADME.[9]

Див. також[ред. | ред. код]

Посилання[ред. | ред. код]

  1. а б Gaulton, A та ін. (2011). ChEMBL: a large-scale bioactivity database for drug discovery. Nucleic Acids Research. 40: D1100-7. doi:10.1093/nar/gkr777. PMC 3245175. PMID 21948594.
  2. а б в Bender, A (2010). Databases: Compound bioactivities go public. Nature Chemical Biology. 6: 309. doi:10.1038/nchembio.354. Архів оригіналу за 30 червня 2011. Процитовано 15 листопада 2010.
  3. Overington J (April 2009). ChEMBL. An interview with John Overington, team leader, chemogenomics at the European Bioinformatics Institute Outstation of the European Molecular Biology Laboratory (EMBL-EBI). Interview by Wendy A. Warr. J. Comput.-Aided Mol. Des. 23 (4): 195—8. Bibcode:2009JCAMD..23..195W. doi:10.1007/s10822-009-9260-9. PMID 19194660.
  4. Mok, N. Yi; Brenk, Ruth (Oct 24, 2011). Mining the ChEMBL Database: An Efficient Chemoinformatics Workflow for Assembling an Ion Channel-Focused Screening Library. J. Chem. Inf. Model. 51 (10): 2449—2454. doi:10.1021/ci200260t.
  5. Brenk, R; Schinpani, A; James, D; Krasowski, A (Mar 2008). Lessons learnt from assembling screening libraries for drug discovery for neglected diseases. ChemMedChem. 3 (3): 435—44. doi:10.1002/cmdc.200700139.
  6. ChEMBL-og (15 November 2010), ChEMBL_08 Released, архів оригіналу за 8 липня 2011, процитовано 15 листопада 2010
  7. ChEMBL-og (6 June 2011), ChEMBL_10 Released, архів оригіналу за 13 серпня 2011, процитовано 9 червня 2011
  8. Bellis, L J та ін. (2011). Collation and data-mining of literature bioactivity data for drug discovery. Biochemical Society Transactions. 39: 1365—1370. doi:10.1042/BST0391365. PMID 21936816. Архів оригіналу за 18 жовтня 2019. Процитовано 24 вересня 2011.
  9. Davies, M та ін. ADME SARfari: Comparative Genomics of Drug Metabolising Systems. Bioinformatics. doi:10.1093/bioinformatics/btv010. Процитовано 8 січня 2015.