Freebase

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
Freebase
Freebase-logo.png
Розробник(и) Metaweb Technologies
Доступні мови Англійська мова
Тип Онлайн БД
Ліцензія Creative Commons Attribution License
Сайт www.freebase.com

Freebase - велика колаборативна база знань що містить метадані складені в основному спільнотою. Це онлайн колекція структурованих даних зібраних з багатьох джерел, наприклад окремих 'Вікі'.[1] Freebase має на меті створити глобальний ресурс що дозволить людям (та машинам) отримувати доступ до загальновідомої інформації набагато ефективніше. Розробляється американською софтверною компанією Metaweb і працює публічно з березня 2007. Metaweb була куплена Google (проанонсовано 16 липня 2010[2]).

Дані Freebase доступні free/libre для комерційного та некомерційного використання під ліцензією Creative Commons Attribution. Для програмістів надається API, RDF endpoint, та дампи. Google News Timeline включає медіаінформацію з Freebase.[3]

Огляд[ред.ред. код]

3 березня 2007 Metaweb публічно анонсувало Freebase, описавши компанію як "відкрита поділена база всіх світових знань," та "масивна багатокористувацька база з даними що взаємопосилаються." Загалом це велетенська модель «сутність - зв'язок», яка багато в чому базується на вікіпедійних даних. Freebase має інтерфейс, який дозволяє непрограмістам заповнювати її інформацією, та категоризувати і об'єднувати елементи даних в змістовний, тобто семантичний спосіб.

Описана Тімом О'Рейлі після запуску, як "міст між баченням колективного інтелекту Веб 2.0 та більш структурованого світу семантичного вебу".[4]

Freebase містить дані зібрані з таких джерел як Вікіпедія, ChefMoz, NNDB, та MusicBrainz, та дані внесені користувачами. Всі дані поширюються під ліцензією Creative Commons Attribution, [4]. Програмістам надається HTTP API, яке дає доступ до даних в форматі JSON. Сирцевий код самого продукту Metaweb є власницьким.

Freebase працює на власній інфраструктурі Metaweb, яка реалізує представлення в виді графа. Це означає, що замість використання таблиць та ключів для опису структур даних, Freebase використовує вузли на набір лінків які встановлюють відношення між вузлами. Через те що дані не ієрархічні, Freebase може моделювати набагато складніші відношення між окремими елементами ніж звичайні БД, та відкрита для додавання нових сутностей та зв'язків в граф.

Запити до бази здійснюються мовою "Metaweb Query Language" (MQL).

Розробка[ред.ред. код]

Денні Хілліс вперше описав ідею створення павутини знань яку він назвав Аристотель в своїй роботі 2000 року. Але він не пробував побудувати систему аж поки не найняв двох техекспертів та співзасновників. Роберт Кук - спеціаліст з паралельних обчислень та дизайну БД, зараз є виконавчим віцепрезидентом Metaweb з розвитку продукту. John Giannandrea, колишній головний технолог у Tellme Networks та головний технолог групи розробки браузерів в Netscape/AOL, є технічним директором компанії.[5]

Спочатку доступна тільки через запрошення, Freebase відкрилася для публічного анонімного доступу на альфа-стадії розробки, і тепер вимагає реєстрації тільки тих хто вносять дані.

29 жовтня 2008, на конференції International Semantic Web Conference 2008, Freebase випустила свій RDF сервіс для генерування RDF представлень сутностей Freebase, дозволяючи використання Freebase як Linked Data.[6]

Організація та політики[ред.ред. код]

Об'єкти про які Freebase містить інформацію (і які часто мають відповідні статті вікіпедії) називаються топіками англ. topics, і дані що зберігаються про них залежать від їх типу. Наприклад запис про губернатора Каліфорнії Арнольда Шварцнеггера, вводиться як топік що включає набір типів що описують його як актора, бодібілдера та політика. Freebase приблизно 11.5 мільйонів топіків на Квітень 2010.[7]

Онтології Freebase, відомі як "типи" - також доступні для редагування.[4] Кожен тип має кілька предикатів що називаються властивостями англ. properties.

на відміну від підходу до семантичної павутини W3C, яка починається з контрольованих онтологій, Metaweb прийняв підхід фолксономії, в якому люди можуть додавати нові категорії (майже як теги), в кашу припущень що потенційно перекриваються.[4]

Freebase має багато відмінностей від моделі вікі. Користувачі можуть створювати свої власні типи, але ці типи не приймаються в "суспільне надбання", поки їх не перевірить працівник Metaweb. Також користувачі не можуть модифікувати типи один одного. Причина того що Freebase не дає можливості зміни схеми в тому, що певні зовнішні сервіси можуть залежати від неї, і зміна схеми, наприклад видалення властивості тягне за собою їхній збої в їх запитах для API, і навіть всередині Freebase (наприклад в збережених розрізах).

Metaweb надає деяким користувачам статус експерта, аналогічний статусу адміністраторів вікіпедії.[8]

Також підтримуються багатомовні дані, але в цей час основною мовою відображення даних для всіх користувачів є англійська.


Критика[ред.ред. код]

Критерії значимості
на відміну від Вікіпедії, Freebase їх не має. Натомість дозволені будь-які дані, що можуть зацікавити когось іншого. Не дозволяються несталі дані, чи такі що мають лише персональну зацікавленість.[9] Відповідно до таких критеріїв дозволяється комерційний вміст, якщо він структурований та містить істинні факти.
Денормалізація
Тип даних створений на Freebase не може редагуватись ніким окрім автора. Це політика що попереджує пошкодження схеми недосвідченими чи недоброзичливими користувачами. Результатом цієї політики є що наполовину завершена схема не може бути вдосконалена іншими користувачами і тому має бути побудована з нуля, що створює дублікати типів.
Дані про відсутність даних
Freebase не має рішення проблеми значень Null, unknown чи N/A.

Застосування[ред.ред. код]

  • Google Refine [1] - інструмент для очищення та отримання даних
  • Powerset [2] - семантичний пошуковий рушій, який здійснює пошук по Freebase відповідей на питання задані природньою мовою (куплений Microsoft та використовується в пошуковій системі Bing).
  • Freebase genealogy - переглядач родоводів.
  • FMDb - Freebase IMDB
  • Freebase sets - клон Google sets що використовує дані Freebase
  • Parallax data viewer - альтернативний інтерфейс користувача
  • Freebase Schema Explorer - візуалізатор онтологій Freebase
  • Thinkbase - візуальний інструмент що базується на графах

Дивись також[ред.ред. код]

Зноски[ред.ред. код]

  1. Markoff, John (2007-03-09). «Start-Up Aims for Database to Automate Web Searching». Нью-Йорк Таймс. Процитовано 2007-03-09. 
  2. Google Blog
  3. «Features : Google News Timeline - Google News Help». www.google.com. Процитовано 2009-06-30. 
  4. а б в г «Freebase Will Prove Addictive». O'Reilly Radar. 2007-03-08. Процитовано 2007-03-09. 
  5. Markoff, John (2007-03-09). «Start-Up Aims for Database to Automate Web Searching». nytimes. Процитовано 2009-02-07. 
  6. «Introducing the Freebase RDF service». Процитовано 2009-02-19. 
  7. http://www.freebase.com/explore
  8. «new-experts-programme». Процитовано 2009-02-07. 
  9. «Freebase Contribution Guidelines». Архів оригіналу за 2013-07-16. Процитовано 2009-02-27. 

Посилання[ред.ред. код]