Видобування знань: відмінності між версіями

[перевірена версія]

← Попереднє редагування Наступне редагування →

Вилучено вміст Додано вміст

Лінійно

Версія за 10:34, 4 червня 2022

Видобування знань (англ. knowledge extraction, рос. извлечение знаний) є створення знань зі структурованих (реляційних баз даних, XML) і неструктурованих (тексти, документи, зображення) джерел. Отримане знання повинно бути збережене у форматі, придатному для автоматичного читання та інтерпретації. Також знання повинні бути представлені таким чином, щоб полегшити логічний висновок. Попри те, що це методично схоже на видобування інформації (англ. Data Mining, NLP) і ETL (зберігання даних), основними критеріями є те, що результат видобування виходить за рамки створення структурованої інформації або перетворення її в реляційну схему. Це вимагає або повторного використання наявних формальних знань (повторне використання ідентифікаторів або онтологій), або генерацію схеми^{[що це?]} на основі вихідних даних.

Група RDB2RDF W3C^[1] в даний час^[коли?] стандартизує мову для видобутку RDF (англ. Resource Description Framework) з реляційних баз даних. Ще одним популярним прикладом видобутку знань є перетворення Вікіпедії в структуровані дані, а також відображення до наявних знань (див. DBpedia і Freebase).

Огляд

Після стандартизації мов представлення знань, таких як RDF і OWL, багато досліджень було проведено в області, особливо щодо перетворення реляційних баз даних в RDF, задачі ідентифікації, виявлення знань і навчання онтологій. Загальний процес використовує традиційні методи добування даних, виймання, перетворення і завантаження (ETL), які перетворюють дані з джерел у структуровані формати.

Наступні критерії можуть бути використані для класифікації підходів в цій темі (деякі з них використовуються лише для видобутку з реляційних баз даних): ^[2]

Джерело	Джерела даних, які використовуються: Текст, реляційні бази даних, XML, CSV
Експозиція	В якому вигляді добуваються дані? (файл онтології, семантична база даних)? Як можна зробити запит?
Синхронізація	Чи виконується процес видобутку знань один раз для отримання дампа або результат синхронізується з джерелом? Статична або динамічна синхронізація. Чи записуються зміни результатів назад (двонаправлена синхронізація)
Повторне використання словників	Інструмент здатний повторно використовувати наявні словники при видобутку. Наприклад, стовпчик таблиці 'FirstName' можуть бути зіставленні з foaf:firstName. Деякі автоматичні підходи не здатні зіставляти словники.
Автоматизація	Ступінь, в якій видобуток вимагає втручання/автоматизований. Допомога оператора, GUI, напівавтоматичний, автоматичний.
Потрібна онтологія предметної області	Потрібно побудувати відображення у вже задану онтологію. Так чином, що або створюється відображення або отримується схема з джерела (навчання онтологій^[en]).

Приклади

Зв'язування об'єктів

DBpedia Spotlight, OpenCalais^[en], Dandelion dataTXT^{[недоступне посилання]}, Zemanta API, Extractiv [Архівовано 29 березня 2017 у Wayback Machine.] та PoolParty Extractor [Архівовано 26 червня 2012 у Wayback Machine.] аналізують вільний текст через розпізнавання іменованих сутностей, а потім усуває неоднозначність кандидатів через розпізнавання імен^[en] та пов'язує знайдені об'єкти зі сховищем знань DBpedia^[3] (див. демо Dandelion dataTXT, DBpedia Spotlight або PoolParty Extractor).

Президент Обама [Архівовано 12 жовтня 2008 у Wayback Machine.] у середу закликав Конгрес продовжити податкові пільги для студентів, включених до економічних стимулів у минулому році, стверджуючи, що політика забезпечує більш щедру допомогу.

Як президент Обама пов'язаний з ресурсом DBpedia Linked data^[en], додаткова інформація може бути отримана автоматично і Semantic Reasoner^[en] може, наприклад, зробити висновок, що згадана особа має тип особи (з використанням FOAF (програмне забезпечення)) і президентів типу Сполучених Штатів (за допомогою YAGO●). Приклади: Методи, які розпізнають тільки об'єкти або посилання на статті Вікіпедії та інших цілей, які не забезпечують подальше вилучення структурованих даних і формальних знань.

Реляційні бази даних в RDF

Triplify, D2R сервера, Ultrawrap і Virtuoso RDF Перегляди інструментів, які трансформують реляційні баз даних RDF. В ході цього процесу вони дозволяють повторно використовувати існуючі словники і онтології в процесі перетворення. При перетворенні типових реляційних таблиць з ім'ям користувачів, один стовпець (наприклад «.name») або сукупність стовпців (наприклад «.first_name» і «last_name») повинен надати URI створеного об'єкта. Зазвичай використовується первинний ключ. Кожен другий стовпець може бути залучен як відношення з цією організацією. Потім використовуються властивості з формально визначеною семантикою (і повторно) інтерпретувати інформацію. Наприклад, стовпець в таблиці користувача з ім'ям marriedTo може бути визначена як симетричне відношення і стовпчик homepage може бути перетворений у власність від FOAF Словник називається FOAF: головна сторінка, таким чином, кваліфікує його як функціональна властивість зворотного. Потім кожен запис таблиці користувача може бути екземпляром класу FOAF: Людина (Онтологія населення). Крім знання предметної області (у формі онтології) можуть бути створені з status_id, або створених вручну правил (якщо status_id 2, запис відноситься до класу Вчителі), або (semi) -автоматичні методи (онтологія навчання). Ось приклад перетворення:

Ім'я	одружений	домашня сторінка	статус
Peter	Mary	http://example.org/Peters_page^{[недоступне посилання з березня 2019]}	1
Claus	Eva	http://example.org/Claus_page^{[недоступне посилання з березня 2019]}	2

 :Peter :marriedTo :Mary .  
 :marriedTo a owl:SymmetricProperty .  
 :Peter foaf:homepage  <http://example.org/Peters_page> .  
 :Peter a foaf:Person .   
 :Peter a :Student .  
 :Claus a :Teacher .

Витяг з структурованих джерел в RDF

1: 1 Відображення з таблиць БД / Види на RDF Entities / Властивості / Значення

При створенні вистави RDB в проблемній області, відправною точкою часто є сутність-зв'язок діаграма (ERD). Як правило, кожним об'єктом представленому у вигляді таблиці бази даних, кожний атрибут сутності стає стовпець в цій таблиці, і відносини між об'єктами позначаються зовнішніми ключами. Кожна таблиця, як правило, визначає конкретний клас суті, кожен стовпець один з його атрибутів. Кожен рядок в таблиці описує екземпляр сутності, однозначно ідентифікується первинним ключем. Рядки таблиці в сукупності описують набір сутностей. В еквівалентній RDF представлення одного і того ж набору сутностей:

Кожен стовпець у таблиці є атрибутом (тобто предикат)
Кожне значення стовпця є значення атрибута (тобто об'єкт)
Кожна клавіша рядок являє собою ідентифікатор об'єкта (тобто суб'єкт)
Кожен рядок є екземпляром сутності
Кожен рядок (екземпляр об'єкта) представлена в RDF колекцією трійок із загальним суб'єктом (ідентифікатор об'єкта)

Таким чином, щоб зробити еквівалентне уявлення на основі RDF семантики, основне відображення алгоритму буде виглядати наступним чином:

створити RDFS клас для кожної таблиці
конвертувати всі первинні ключі та зовнішні ключі в IRIs
призначити предикат IRI для кожного стовпчика
призначити РДФ: тип предиката для кожного рядка, пов'язуючи його з ІСС класу IRI відповідає таблиці
для кожного стовпчика, який не є ні частиною первинного або зовнішнього ключа, побудувати потрійний, який містить первинний ключ IRI як суб'єкта, стовпець IRI як предиката і значення стовпця як об'єкт.

Найперша згадка цього основного або прямого відображення можна знайти в порівнянні Тім Бернерс-Лі моделі ER до моделі RDF. ^[4].

Складні відображення реляційних баз даних в RDF

1: 1 згадуване вище надає застарілі дані у вигляді RDF прямим шляхом, додаткові уточнення можуть бути використані для підвищення корисності RDF виведення відповідного до Use Cases. Як правило, втрачається інформація в процесі перетворення в сутність-зв'язок діаграми (ERD) для реляційних таблиць (подробиці можна знайти в об'єктно-реляційному імпедансі) і повинна бути зворотня інженерія. З концептуальної точки зору, підходи до видобутку можуть надходити з двох напрямків. Перший напрямок намагається витягти або дізнатися-схему OWL з даної схеми бази даних. Ранні підходи використовували фіксовану кількість створених вручну правил відображення для уточнення відображення 1:1^[5]^[6]^[7]. Більш складні методи з використанням евристики або алгоритмів навчання, щоб викликати схематичну інформацію (методи перекриватися з навчанням онтологій). У той час як деякі підходи намагаються витягти інформацію зі структури, властивої схемою SQL^[8] (аналізуючи наприклад, зовнішні ключі), інші аналізують зміст і значення в таблицях для створення концептуальних ієрархій^[9] (наприклад, стовпці з декількома значеннями є кандидатами для становлення категорії), Другий напрямок намагається відобразити схему і його вміст вже існуючої онтології предметної області (дивись також: вирівнювання онтології). Часто, однак, відповідна онтологія не існує, і повинен бути створений першим.

XML

Так як XML структурована у вигляді дерева, будь-які дані можуть бути легко представлені в RDF, який структурований у вигляді графіка. XML2RDF є одним із прикладів такого підходу, який використовує RDF порожні вузли і перетворює XML-елементи і атрибути властивостей RDF. Тема, однак, є більш складним, як і в разі реляційних баз даних. У реляційної таблиці первинний ключ є ідеальним кандидатом, щоб стати предметом здобутих трійок. XML-елемент, однак, можуть бути перетворені — в залежності від контексту — як суб'єкт, предикат або об'єкт потрійний. XSLT може бути використаний стандартний мову перетворення вручну перетворити XML в RDF.

Огляд методів / Інструменти

Name	Data Source	Data Exposition	Data Synchronisation	Mapping Language	Vocabulary Reuse	Mapping Automat.	Req. Domain Ontology	Uses GUI
A Direct Mapping of Relational Data to RDF [Архівовано 9 травня 2016 у Wayback Machine.]	Relational Data	SPARQL/ETL	dynamic	N/A	false	automatic	false	false
CSV2RDF4LOD [Архівовано 22 серпня 2016 у Wayback Machine.]	CSV	ETL	static	RDF	true	manual	false	false
Convert2RDF [Архівовано 22 вересня 2016 у Wayback Machine.]	Delimited text file	ETL	static	RDF/DAML	true	manual	false	true
D2R Server [Архівовано 26 лютого 2012 у Wayback Machine.]	RDB	SPARQL	bi-directional	D2R Map	true	manual	false	false
DartGrid	RDB	own query language	dynamic	Visual Tool	true	manual	false	true
DataMaster [Архівовано 21 травня 2016 у Wayback Machine.]	RDB	ETL	static	proprietary	true	manual	true	true
Google Refine's RDF Extension	CSV, XML	ETL	static	none	semi-automatic	false	true
Krextor	XML	ETL	static	xslt	true	manual	true	false
MAPONTO [Архівовано 2 червня 2016 у Wayback Machine.]	RDB	ETL	static	proprietary	true	manual	true	false
METAmorphoses [Архівовано 17 квітня 2016 у Wayback Machine.]	RDB	ETL	static	proprietary xml based mapping language	true	manual	false	true
MappingMaster	CSV	ETL	static	MappingMaster	true	GUI	false	true
ODEMapster	RDB	ETL	static	proprietary	true	manual	true	true
OntoWiki CSV Importer Plug-in — DataCube & Tabular	CSV	ETL	static	The RDF Data Cube Vocaublary	true	semi-automatic	false	true
Poolparty Extraktor (PPX) [Архівовано 26 червня 2012 у Wayback Machine.]	XML, Text	LinkedData	dynamic	RDF (SKOS)	true	semi-automatic	true	false
RDBToOnto	RDB	ETL	static	none	false	automatic, the user furthermore has the chance to fine-tune results	false	true
RDF 123 [Архівовано 20 липня 2011 у Wayback Machine.]	CSV	ETL	static	false	false	manual	false	true
RDOTE	RDB	ETL	static	SQL	true	manual	true	true
Relational.OWL	RDB	ETL	static	none	false	automatic	false	false
T2LD [Архівовано 20 липня 2011 у Wayback Machine.]	CSV	ETL	static	false	false	automatic	false	false
The RDF Data Cube Vocabulary	Multidimensional statistical data in spreadsheets	Data Cube Vocabulary	true	manual	false
TopBraid Composer	CSV	ETL	static	SKOS	false	semi-automatic	false	true
Triplify [Архівовано 6 січня 2009 у Wayback Machine.]	RDB	LinkedData	dynamic	SQL	true	manual	false	false
Ultrawrap	RDB	SPARQL/ETL	dynamic	R2RML	true	semi-automatic	false	true
Virtuoso RDF Views [Архівовано 5 вересня 2014 у Wayback Machine.]	RDB	SPARQL	dynamic	Meta Schema Language	true	semi-automatic	false	true
Virtuoso Sponger [Архівовано 5 вересня 2014 у Wayback Machine.]	structured and semi-structured data sources	SPARQL	dynamic	Virtuoso PL & XSLT	true	semi-automatic	false	false
VisAVis	RDB	RDQL	dynamic	SQL	true	manual	true	true
XLWrap: Spreadsheet to RDF [Архівовано 8 травня 2016 у Wayback Machine.]	CSV	ETL	static	TriG Syntax	true	manual	false	false
XML to RDF [Архівовано 11 травня 2016 у Wayback Machine.]	XML	ETL	static	false	false	automatic	false	false

Витяг з природних джерел мови

Найбільша частина інформації, що міститься в бізнес-документах (близько 80 %^[10]) кодується природною мовою і, отже, неструктурована. Оскільки неструктуровані дані є досить складним завданням для вилучення знань, більш складні методи необхідні, які, як правило, поставляють гірші результати в порівнянні з неструктурованими даними. Потенціал для масового придбання здобутих знань, проте, повинні компенсувати підвищену складність і зниження якості видобутку. Надалі, природні джерела мови розуміються як джерела інформації, де дані наведені неструктурованим чином, як звичайний текст. Якщо даний текст додатково вбудований в розмітки документа (е. Г. HTML документ), згадані системи зазвичай видаляють елементи розмітки автоматично.

Традиційне вилучення інформації (IE)

Традиційне вилучення інформації^[11] є технологією обробки природної мови, яке витягує інформацію з текстів природною мовою, як правило, і структури даних відповідним чином. Види інформації, що підлягає ідентифікованого повинні бути вказані як модель перед початком процесу, тому весь процес традиційного вилучення інформації залежний. IE розділений на наступні п'ять підзадач.

визнання Названий об'єкт (ВНО)
Резолюція кореферентності (РК)
Шаблон будівельного елементу (ШБ)
Шаблон ставлення конструкції (ШС)
Шаблон виробництва сценарій (ШВ)

Завдання названого розпізнавання особи є визнати і класифікувати всі названі об'єкти, що містяться в тексті (присвоєння імені об'єкта до визначеної категорії). Це працює шляхом застосування граматики на основі методів або статистичних моделей.

Дозвіл конферентногсті визначає еквівалентні об'єкти, які були визнані НЕК, в тексті. Існують два види відповідних відносин еквівалентності. Перший з них відноситься до відносин між двома різними представленими суб'єктами (наприклад, IBM Europe і IBM), а другий до відносин між суб'єктом і їх анафорических посилань (наприклад, він і IBM). Обидва види можуть бути визнані відповідно до резолюції кореферентності.

Під час будівництва елемента шаблону система ідентифікує IE описові властивості сутностей, визнаних НЕК і CO. Ці властивості відповідають звичайним якостям, як червоний або великий.

Шаблонна конструкція відношення визначає відносини, які існують між елементами шаблону. Ці відносини можуть бути декількох видів, таких як роботи з питання або знаходження, з обмеженням, що обидва домени і діапазон відповідають суб'єктам.

У шаблоні сценарію здійснюються події, які описані в тексті, вони будуть визначені і структуровані щодо осіб, визнаних Нью-Йорку і СО і відносин, які були визначені TR.

Онтологія на основі вилучення інформації (OBIE)

Онтологія на основі вилучення інформації є полем вилучення інформації, за допомогою якої щонайменше одна онтологія використовується для управління процесом добування інформації з текстів природною мовою. Система OBIE використовує методи традиційної вилучення інформації для ідентифікації понять, екземпляри і відносини використовуваних онтологій в тексті, які будуть структуровані з онтологією після процесу. Таким чином, вхідна онтологія є моделлю інформації, яку необхідно витягти.

Онтологія навчання (ОН)

Вивчення Онтології є автоматичним або напівавтоматичним створення онтологій, включаючи витяг термінів відповідної області від природного тексту мови. Оскільки будівля онтологій вручну є надзвичайно трудомістким і займає багато часу, є велика мотивація для автоматизації процесу.

Семантична анотація (SA)

Під час семантичної анотації^[12], текст природною мовою доповнюється метаданими (часто представлені в RDFa), які повинні складати семантику термінів, що містяться машини зрозумілим. У цьому процесі, який, як правило, напівавтоматична, знання видобувається в тому сенсі, що зв'язок між лексичних термінів і понять, наприклад, з онтологією встановлюється. Таким чином, знання здобувається, що значення терміна в обробленому контексті був призначений і, отже, сенс тексту ґрунтується на машинозчитуваних даних з можливістю зробити висновки. Семантичне анотування як правило, розділені на наступні дві підзадачі.

екстракція Термінологія
Об'єкт зв'язування

На рівні вилучення термінології, лексичні терміни з тексту витягуються. Для цієї мети токенізатор визначає спочатку кордони слів і вирішує скорочити. Згодом терміни з тексту, які відповідають концепції, витягуються за допомогою лексикону предметно-орієнтованого щоб зв'язати ці по суті посилання.

По суті пов'язуючи^[13] зв'язок між видобутих лексичних термінів з вихідного тексту і понять з онтології або бази знань, таких як встановлено DBpedia. Для цього, кандидати-концепції виявляються відповідно в декількох значеннях терміна за допомогою лексикону. І, нарешті, контекст термінів аналізується з метою визначення найбільш підходящої однозначністі і призначити термін для правильної концепції.

інструменти

Наступні критерії можуть бути використані для класифікації інструментів, які витягують знання з текстів природною мовою.

Джерело	Які формати введення можуть бути оброблені за допомогою інструменту (наприклад, простий текст, HTML або PDF)?
Доступ до Paradigm	Чи може інструмент запитувати джерела даних або потребує цілого дампа для процесу екстракції?
Синхронізація даних	Є результатом процесу екстракції синхронізований з джерелом?
Використання Output Ontology	Чи зв'язані інструмент результат з онтологією?
Mapping Автоматизація	Як це автоматизований процес екстракції (ручний, напівавтоматичний або автоматичний)?
вимагає Онтологія	Чи потрібно інструмент онтології для вилучення?
Використання графічного інтерфейсу користувача	Чи надає інструмент графічний інтерфейс користувача?
Підхід	Який підхід (IS, OBIE, ПР або SA) використовується інструментом?
Витягнуті Сутності	Які типи сутностей (наприклад, названі особи, поняття або відношення) можуть бути вилучені за допомогою інструменту?
Застосовувані методи	Які методи застосовуються (наприклад, NLP, статистичні методи, кластеризація або машинного навчання)?
Вихід моделі	Яка модель використовується для представлення результату інструменту (е. Г. RDF або OWL)?
Підтримувані домени	Які домени підтримуються (наприклад, економіка або біологія)?
Підтримувані Мови	Які мови можуть бути оброблені (наприклад, англійську чи німецьку)?

У наведеній нижче таблиці характеризується деякі інструменти для здобуття знань з природних джерел мови.

Назва	Джерело	доступ до Paradigm	Data Synchronization	Uses Output Ontology	Mapping Automation	Requires Ontology	Uses GUI	Approach	Extracted Entities	Applied Techniques	Output Model	Supported Domains	Supported Languages
AeroText^[14]	plain text, HTML, XML, SGML	dump	no	yes	automatic	yes	yes	IE	named entities, relationships, events	linguistic rules	proprietary	domain-independent	English, Spanish, Arabic, Chinese, indonesian
AlchemyAPI [Архівовано 1 серпня 2013 у Wayback Machine.]^[15]	plain text, HTML	automatic	yes	SA	multilingual
ANNIE [Архівовано 15 березня 2016 у Wayback Machine.]^[16]	plain text	dump	yes	yes	IE	finite state algorithms	multilingual
ASIUM [Архівовано 11 червня 2017 у Wayback Machine.]^[17]	plain text	dump	semi-automatic	yes	OL	concepts, concept hierarchy	NLP, clustering
Attensity Exhaustive Extraction^[18]	automatic	IE	named entities, relationships, events	NLP
Dandelion API [Архівовано 28 травня 2016 у Wayback Machine.]	plain text, HTML, URL	REST	no	no	automatic	no	yes	SA	named entities, concepts	statistical methods	JSON	domain-independent	multilingual
DBpedia Spotlight^[19]	plain text, HTML	dump, SPARQL	yes	yes	automatic	no	yes	SA	annotation to each word, annotation to non-stopwords	NLP, statistical methods, machine learning	RDFa	domain-independent	English
EntityClassifier.eu [Архівовано 3 березня 2016 у Wayback Machine.]	plain text, HTML	dump	yes	yes	automatic	no	yes	IE, OL, SA	annotation to each word, annotation to non-stopwords	rule-based grammar	XML	domain-independent	English, German, Dutch
FRED [Архівовано 8 травня 2016 у Wayback Machine.]^[20]	plain text, PDF and Word via Sheldon [Архівовано 20 травня 2016 у Wayback Machine.]	dump, REST	yes	automatic	no	yes	OL+IE+SA	concepts, concept hierarchy, frames, events, relationships, named entities, negation, modality, tense, entity linking, schema alignment, sentiment (via Sentilo [Архівовано 18 червня 2016 у Wayback Machine.])	NLP, SPARQL, heuristical rules, ontology design patterns	RDF-OWL, Turtle, NT, JSON-LD, DAG, diagrams	domain-independent	English, multilingual input
K-Extractor^[21]^[22]	plain text, HTML, XML, PDF, MS Office, e-mail	dump, SPARQL	yes	yes	automatic	no	yes	IE, OL, SA	concepts, named entities, instances, concept hierarchy, generic relationships, user-defined relationships, events, modality, tense, entity linking, event linking, sentiment	NLP, machine learning, heuristic rules	RDF, OWL, proprietary XML	domain-independent	English, Spanish
iDocument [Архівовано 21 червня 2021 у Wayback Machine.]^[23]	HTML, PDF, DOC	SPARQL	yes	yes	OBIE	instances, property values	NLP	personal, business
NetOwl Extractor [Архівовано 9 квітня 2016 у Wayback Machine.]^[24]	plain text, HTML, XML, SGML, PDF, MS Office	dump	No	Yes	Automatic	yes	Yes	IE	named entities, relationships, events	NLP	XML, JSON, RDF-OWL, others	multiple domains	English, Arabic Chinese (Simplified and Traditional), French, Korean, Persian (Farsi and Dari), Russian, Spanish
OntoGen [Архівовано 30 березня 2010 у Wayback Machine.] [Архівовано 30 березня 2010 у Wayback Machine.]^[25]	semi-automatic	yes	OL	concepts, concept hierarchy, non-taxonomic relations, instances	NLP, machine learning, clustering
OntoLearn [Архівовано 9 серпня 2017 у Wayback Machine.] [Архівовано 9 серпня 2017 у Wayback Machine.]^[26]	plain text, HTML	dump	no	yes	automatic	yes	no	OL	concepts, concept hierarchy, instances	NLP, statistical methods	proprietary	domain-independent	English
OntoLearn Reloaded [Архівовано 4 березня 2016 у Wayback Machine.]	plain text, HTML	dump	no	yes	automatic	yes	no	OL	concepts, concept hierarchy, instances	NLP, statistical methods	proprietary	domain-independent	English
OntoSyphon [Архівовано 10 березня 2016 у Wayback Machine.]^[27]	HTML, PDF, DOC	dump, search engine queries	no	yes	automatic	yes	no	OBIE	concepts, relations, instances	NLP, statistical methods	RDF	domain-independent	English
ontoX [Архівовано 27 травня 2016 у Wayback Machine.]^[28]	plain text	dump	no	yes	semi-automatic	yes	no	OBIE	instances, datatype property values	heuristic-based methods	proprietary	domain-independent	language-independent
OpenCalais [Архівовано 24 жовтня 2008 у Wayback Machine.]	plain text, HTML, XML	dump	no	yes	automatic	yes	no	SA	annotation to entities, annotation to events, annotation to facts	NLP, machine learning	RDF	domain-independent	English, French, Spanish
PoolParty Extractor [Архівовано 17 травня 2016 у Wayback Machine.]^[29]	plain text, HTML, DOC, ODT	dump	no	yes	automatic	yes	yes	OBIE	named entities, concepts, relations, concepts that categorize the text, enrichments	NLP, machine learning, statistical methods	RDF, OWL	domain-independent	English, German, Spanish, French
Rosoka [Архівовано 10 травня 2016 у Wayback Machine.]^[30]	plain text, HTML, XML, SGML, PDF, MS Office	dump	Yes	Yes	Automatic	no	Yes	IE	named entities, relationships, attributes, concepts	NLP	XML, JSON, RDF, others	multiple domains	Multilingual (230)
SCOOBIE [Архівовано 11 червня 2018 у Wayback Machine.]	plain text, HTML	dump	no	yes	automatic	no	no	OBIE	instances, property values, RDFS types	NLP, machine learning	RDF, RDFa	domain-independent	English, German
SemTag [Архівовано 11 червня 2017 у Wayback Machine.]^[31]^[32]	HTML	dump	no	yes	automatic	yes	no	SA	machine learning	database record	domain-independent	language-independent
smart FIX [Архівовано 17 травня 2016 у Wayback Machine.]	plain text, HTML, PDF, DOC, e-Mail	dump	yes	no	automatic	no	yes	OBIE	named entities	NLP, machine learning	proprietary	domain-independent	English, German, French, Dutch, polish
Text2Onto [Архівовано 2 травня 2016 у Wayback Machine.]^[33]	plain text, HTML, PDF	dump	yes	no	semi-automatic	yes	yes	OL	concepts, concept hierarchy, non-taxonomic relations, instances, axioms	NLP, statistical methods, machine learning, rule-based methods	OWL	deomain-independent	English, German, Spanish
Text-To-Onto [Архівовано 15 травня 2013 у Wayback Machine.]^[34]	plain text, HTML, PDF, PostScript	dump	semi-automatic	yes	yes	OL	concepts, concept hierarchy, non-taxonomic relations, lexical entities referring to concepts, lexical entities referring to relations	NLP, machine learning, clustering, statistical methods	German
ThatNeedle [Архівовано 13 травня 2016 у Wayback Machine.]	Plain Text	dump	automatic	no	concepts, relations, hierarchy	NLP, proprietary	JSON	multiple domains	English
The Wiki Machine^[35]	plain text, HTML, PDF, DOC	dump	no	yes	automatic	yes	yes	SA	annotation to proper nouns, annotation to common nouns	machine learning	RDFa	domain-independent	English, German, Spanish, French, Portuguese, Italian, Russian
ThingFinder^[36]	IE	named entities, relationships, events	multilingual

Виявлення знань

Виявлення знань описує процес автоматичного пошуку великих обсягів даних для моделей, які можна вважати знання про дані^[37]. Він часто описується як вилучення знань з вхідних даних. Виявлення знань розвинулася з області інтелектуального аналізу даних, а також тісно пов'язана з нею як з точки зору методології та термінології. ^[38]

Найбільш відома гілка інтелектуального аналізу даних є виявлення знань, також відомий як виявлення знань в базах даних (KDD). Так само, як і багато інших форм виявлення знань створює абстракції вхідних даних. Знання, отримані в процесі, можуть стати додаткові дані, які можуть бути використані для подальшого використання і відкриття. Часто результати від виявлення знань не дієві, відкриття знання дієві, також відомий як домен приводом інтелектуального аналізу даних, має на меті виявити та доставити дієві знання та ідеї.

Іншим перспективним застосування виявлення знань в області модернізації програмного забезпечення, виявлення слабкості і дотримання яких передбачає розуміння існуючих програмних артефактів. Цей процес пов'язаний з концепцією зворотної інженерії. Як правило, знання, отримані з існуючого програмного забезпечення представлені у вигляді моделей, в якій конкретні запити можуть бути зроблені при потреби. Відносини суті є найчастішим форматом представлення знань, отриманих з існуючого програмного забезпечення. Об'єкт Management Group (OMG) розробила специфікації знання Discovery Metamodel (KDM), який визначає онтологію для засобів програмного забезпечення та їх відносин з метою виконання виявлення знань всі наявні коди. Виявлення знань з існуючих програмних систем, також відомий як програмне забезпечення видобутку корисних копалин тісно пов'язана з видобутком корисних копалин даних, оскільки існуючі програмні артефакти містять величезне значення для управління ризиками та вартості бізнесу, ключ для оцінки та розвитку програмних систем. Замість того, щоб видобуток окремих наборів даних, гірничодобувної промисловості програмного забезпечення фокусується на метаданих, таких як потоки процесу (наприклад, потоки даних, потоки управління, & назвати карти), архітектура, схеми баз даних і бізнес-правила / умови / процесу.

Вхідні дані

бази даних
- реляційні дані
- база даних
- складський документ
- Інформаційне сховище
програмне забезпечення
- вихідні дані
- файли конфігурації
- побудова сценаріїв
Текст
- концепція гірничодобувної промисловості
діаграми
- молекула сенс
послідовності
- видобуток потоку даних
- Навчання від змінюються в часі потоків даних в рамках концепції дрейфу
Веб

вихідні формати

Модель даних
Метадані
метамоделі
онтологія
уявлення знань
теги знань
бізнес-правила
Знання Discovery Metamodel (КДМ)
Моделювання бізнес-процесів нотація (BPMN)
проміжне представлення
Resource Description Framework (RDF)
метрики програмного забезпечення

Див. також

кластеризація
археологія даних
Видобуток даних
інтелектуального аналізу даних домену приводом
Інтелектуального аналізу даних в сільському господарстві
Витяг, перетворення, завантаження
інформація Видобуток
Подання знань і висновок

Примітки

↑ RDB2RDF Working Group, Website: http://www.w3.org/2001/sw/rdb2rdf/ [Архівовано 11 травня 2016 у Wayback Machine.], charter: http://www.w3.org/2009/08/rdb2rdf-charter [Архівовано 20 березня 2016 у Wayback Machine.], R2RML: RDB to RDF Mapping Language: http://www.w3.org/TR/r2rml/ [Архівовано 10 жовтня 2021 у Wayback Machine.] Помилка цитування: Некоректний тег <ref>; назва «RDB2RDF» визначена кілька разів з різним вмістом
↑ LOD2 EU Deliverable 3.1.1 Knowledge Extraction from Structured Sources http://static.lod2.eu/Deliverables/deliverable-3.1.1.pdf [Архівовано 27 серпня 2011 у Wayback Machine.]
↑ Life in the Linked Data Cloud. www.opencalais.com. Архів оригіналу за 24 листопада 2009. Процитовано 10 листопада 2009. Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format.
↑ Tim Berners-Lee (1998), «Relational Databases on the Semantic Web» [Архівовано 16 березня 2016 у Wayback Machine.]. Retrieved: February 20, 2011.
↑ Hu et al. (2007), «Discovering Simple Mappings Between Relational Database Schemas and Ontologies», In Proc. of 6th International Semantic Web Conference (ISWC 2007), 2nd Asian Semantic Web Conference (ASWC 2007), LNCS 4825, pages 225‐238, Busan, Korea, 11‐15 November 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.6934&rep=rep1&type=pdf [Архівовано 15 жовтня 2012 у Wayback Machine.]
↑ R. Ghawi and N. Cullot (2007), «Database-to-Ontology Mapping Generation for Semantic Interoperability». In Third International Workshop on Database Interoperability (InterDB 2007). http://le2i.cnrs.fr/IMG/publications/InterDB07-Ghawi.pdf [Архівовано 4 березня 2016 у Wayback Machine.]
↑ Li et al. (2005) «A Semi-automatic Ontology Acquisition Method for the Semantic Web», WAIM, volume 3739 of Lecture Notes in Computer Science, page 209—220. Springer. http://dx.doi.org/10.1007/11563952_19 [Архівовано 26 липня 2008 у Wayback Machine.]
↑ Tirmizi et al. (2008), «Translating SQL Applications to the Semantic Web», Lecture Notes in Computer Science, Volume 5181/2008 (Database and Expert Systems Applications). http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=15E8AB2A37BD06DAE59255A1AC3095F0?doi=10.1.1.140.3169&rep=rep1&type=pdf [Архівовано 4 березня 2016 у Wayback Machine.]
↑ Farid Cerbah (2008). «Learning Highly Structured Semantic Repositories from Relational Databases», The Semantic Web: Research and Applications, volume 5021 of Lecture Notes in Computer Science, Springer, Berlin / Heidelberg http://www.tao-project.eu/resources/publications/cerbah-learning-highly-structured-semantic-repositories-from-relational-databases.pdf [Архівовано 20 липня 2011 у Wayback Machine.]
↑ Wimalasuriya, Daya C.; Dou, Dejing (2010). «Ontology-based information extraction: An introduction and a survey of current approaches», Journal of Information Science, 36(3), p. 306—323, http://ix.cs.uoregon.edu/~dou/research/papers/jis09.pdf [Архівовано 11 квітня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Cunningham, Hamish (2005). «Information Extraction, Automatic», Encyclopedia of Language and Linguistics, 2, p. 665—677, http://gate.ac.uk/sale/ell2/ie/main.pdf [Архівовано 5 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Erdmann, M.; Maedche, Alexander; Schnurr, H.-P.; Staab, Steffen (2000). «From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools», Proceedings of the COLING, http://www.ida.liu.se/ext/epa/cis/2001/002/paper.pdf [Архівовано 3 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Rao, Delip; McNamee, Paul; Dredze, Mark (2011). «Entity Linking: Finding Extracted Entities in a Knowledge Base», Multi-source, Multi-lingual Information Extraction and Summarization, http://www.cs.jhu.edu/~delip/entity-linking.pdf^{[недоступне посилання з березня 2019]} (retrieved: 18.06.2012).
↑ Rocket Software, Inc. (2012). «technology for extracting intelligence from text», http://www.rocketsoftware.com/products/aerotext [Архівовано 21 червня 2013 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Orchestr8 (2012): «AlchemyAPI Overview», http://www.alchemyapi.com/api [Архівовано 1 серпня 2013 у Wayback Machine.] (retrieved: 18.06.2012).
↑ The University of Sheffield (2011). «ANNIE: a Nearly-New Information Extraction System», http://gate.ac.uk/sale/tao/splitch6.html#chap:annie [Архівовано 15 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
↑ ILP Network of Excellence. «ASIUM (LRI)», http://www-ai.ijs.si/~ilpnet2/systems/asium.html [Архівовано 11 червня 2017 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Attensity (2012). «Exhaustive Extraction», http://www.attensity.com/products/technology/semantic-server/exhaustive-extraction/ [Архівовано 11 липня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Mendes, Pablo N.; Jakob, Max; Garcia-Sílva, Andrés; Bizer; Christian (2011). «DBpedia Spotlight: Shedding Light on the Web of Documents», Proceedings of the 7th International Conference on Semantic Systems, p. 1 — 8, http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/research/publications/Mendes-Jakob-GarciaSilva-Bizer-DBpediaSpotlight-ISEM2011.pdf [Архівовано 5 квітня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Presutti, Valentina; Draicchio, Francesco; Gangemi, Aldo (2012). «Knowledge Extraction based on Discourse Representation Theory and Linguistic Frames», «Proceedings of the Conference on Knowledge Engineering and Knowledge Management (EKAW2012), LNCS, Springer», http://www.researchgate.net/profile/Aldo_Gangemi/publication/262175193_Knowledge_extraction_based_on_discourse_representation_theory_and_linguistic_frames/links/5488b1bb0cf268d28f08fde6.pdf (retrieved: 18.01.2015).
↑ Balakrishna, Mithun; Moldovan, Dan (2013). "Automatic Building of Semantically Rich Domain Models from Unstructured Data", Proceedings of the Twenty-Sixth International Florida Artificial Intelligence Research Society Conference (FLAIRS), p. 22 - 27, http://www.aaai.org/ocs/index.php/FLAIRS/FLAIRS13/paper/view/5909/6036 [Архівовано 4 березня 2016 у Wayback Machine.] (retrieved: 11.08.2014)
↑ 2. Moldovan, Dan; Blanco, Eduardo (2012). «Polaris: Lymba's Semantic Parser», Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC), p. 66 — 72, http://www.lrec-conf.org/proceedings/lrec2012/pdf/176_Paper.pdf [Архівовано 12 серпня 2014 у Wayback Machine.] (retrieved: 11.08.2014)
↑ Adrian, Benjamin; Maus, Heiko; Dengel, Andreas (2009). «iDocument: Using Ontologies for Extracting Information from Text», http://www.dfki.uni-kl.de/~maus/dok/AdrianMausDengel09.pdf [Архівовано 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
↑ SRA International, Inc. (2012). «NetOwl Extractor», http://www.sra.com/netowl/entity-extraction/ [Архівовано 24 вересня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Fortuna, Blaz; Grobelnik, Marko; Mladenic, Dunja (2007). «OntoGen: Semi-automatic Ontology Editor», Proceedings of the 2007 conference on Human interface, Part 2, p. 309—318, http://analytics.ijs.si/~blazf/papers/OntoGen2_HCII2007.pdf [Архівовано 18 вересня 2013 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Missikoff, Michele; Navigli, Roberto; Velardi, Paola (2002). «Integrated Approach to Web Ontology Learning and Engineering», Computer, 35(11), p. 60 — 63, http://wwwusers.di.uniroma1.it/~velardi/IEEE_C.pdf [Архівовано 19 травня 2017 у Wayback Machine.] (retrieved: 18.06.2012).
↑ McDowell, Luke K.; Cafarella, Michael (2006). «Ontology-driven Information Extraction with OntoSyphon», Proceedings of the 5th international conference on The Semantic Web, p. 428—444, http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf [Архівовано 10 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Yildiz, Burcu; Miksch, Silvia (2007). «ontoX — A Method for Ontology-Driven Information Extraction», Proceedings of the 2007 international conference on Computational science and its applications, 3, p. 660—673, http://publik.tuwien.ac.at/files/pub-inf_4769.pdf [Архівовано 5 липня 2017 у Wayback Machine.] (retrieved: 18.06.2012).
↑ semanticweb.org (2011). «PoolParty Extractor», http://semanticweb.org/wiki/PoolParty_Extractor [Архівовано 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
↑ IMT Holdings, Corp (2013). «Rosoka», http://www.rosoka.com/content/capabilities [Архівовано 10 травня 2016 у Wayback Machine.] (retrieved: 08.08.2013).
↑ Dill, Stephen; Eiron, Nadav; Gibson, David; Gruhl, Daniel; Guha, R.; Jhingran, Anant; Kanungo, Tapas; Rajagopalan, Sridhar; Tomkins, Andrew; Tomlin, John A.; Zien, Jason Y. (2003). «SemTag and Seeker: Bootstraping the Semantic Web via Automated Semantic Annotation», Proceedings of the 12th international conference on World Wide Web, p. 178—186, http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html [Архівовано 11 червня 2017 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Uren, Victoria; Cimiano, Philipp; Iria, José; Handschuh, Siegfried; Vargas-Vera, Maria; Motta, Enrico; Ciravegna, Fabio (2006). «Semantic annotation for knowledge management: Requirements and a survey of the state of the art», Web Semantics: Science, Services and Agents on the World Wide Web, 4(1), p. 14 — 28, http://staffwww.dcs.shef.ac.uk/people/J.Iria/iria_jws06.pdf^{[недоступне посилання з травня 2019]}, (retrieved: 18.06.2012).
↑ Cimiano, Philipp; Völker, Johanna (2005). «Text2Onto — A Framework for Ontology Learning and Data-Driven Change Discovery», Proceedings of the 10th International Conference of Applications of Natural Language to Information Systems, 3513, p. 227—238, http://www.cimiano.de/Publications/2005/nldb05/nldb05.pdf [Архівовано 14 травня 2013 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Maedche, Alexander; Volz, Raphael (2001). «The Ontology Extraction & Maintenance Framework Text-To-Onto», Proceedings of the IEEE International Conference on Data Mining, http://users.csc.calpoly.edu/~fkurfess/Events/DM-KM-01/Volz.pdf [Архівовано 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Machine Linking. «We connect to the Linked Open Data cloud», http://thewikimachine.fbk.eu/html/index.html [Архівовано 19 липня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Inxight Federal Systems (2008). «Inxight ThingFinder and ThingFinder Professional», http://inxightfedsys.com/products/sdks/tf/ [Архівовано 29 червня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
↑ Frawley William. F. et al. (1992), «Knowledge Discovery in Databases: An Overview», AI Magazine (Vol 13, No 3), 57-70 (online full version: http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1011 [Архівовано 4 березня 2016 у Wayback Machine.])
↑ Fayyad U. et al. (1996), «From Data Mining to Knowledge Discovery in Databases», AI Magazine (Vol 17, No 3), 37-54 (online full version: http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1230 [Архівовано 4 травня 2016 у Wayback Machine.]

Помилка цитування: Тег <ref> з назвою «lod2_eu», визначений у <references> в групі «», нічого не містить.
Помилка цитування: Тег <ref> з назвою «Fayyad1996», визначений у <references> в групі «», нічого не містить.
Помилка цитування: Тег <ref> з назвою «Adrian», визначений у <references> в групі «», нічого не містить.
Помилка цитування: Тег <ref> з назвою «Orchestr8», визначений у <references> в групі «», нічого не містить.
Помилка цитування: Тег <ref> з назвою «Rocket-Software-Inc», визначений у <references> в групі «», нічого не містить.

Помилка цитування: Тег <ref> з назвою «Yildiz», визначений у <references> в групі «», нічого не містить.

[RDB2RDF-1] RDB2RDF Working Group, Website: http://www.w3.org/2001/sw/rdb2rdf/ [Архівовано 11 травня 2016 у Wayback Machine.], charter: http://www.w3.org/2009/08/rdb2rdf-charter [Архівовано 20 березня 2016 у Wayback Machine.], R2RML: RDB to RDF Mapping Language: http://www.w3.org/TR/r2rml/ [Архівовано 10 жовтня 2021 у Wayback Machine.] Помилка цитування: Некоректний тег <ref>; назва «RDB2RDF» визначена кілька разів з різним вмістом

[lod2_eu-2] LOD2 EU Deliverable 3.1.1 Knowledge Extraction from Structured Sources http://static.lod2.eu/Deliverables/deliverable-3.1.1.pdf [Архівовано 27 серпня 2011 у Wayback Machine.]

[OpenCalaisLinkedData-3] Life in the Linked Data Cloud. www.opencalais.com. Архів оригіналу за 24 листопада 2009. Процитовано 10 листопада 2009. Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format.

[timbl_reldb4semweb-4] Tim Berners-Lee (1998), «Relational Databases on the Semantic Web» [Архівовано 16 березня 2016 у Wayback Machine.]. Retrieved: February 20, 2011.

[Hu-5] Hu et al. (2007), «Discovering Simple Mappings Between Relational Database Schemas and Ontologies», In Proc. of 6th International Semantic Web Conference (ISWC 2007), 2nd Asian Semantic Web Conference (ASWC 2007), LNCS 4825, pages 225‐238, Busan, Korea, 11‐15 November 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.6934&rep=rep1&type=pdf [Архівовано 15 жовтня 2012 у Wayback Machine.]

[Ghawi-6] R. Ghawi and N. Cullot (2007), «Database-to-Ontology Mapping Generation for Semantic Interoperability». In Third International Workshop on Database Interoperability (InterDB 2007). http://le2i.cnrs.fr/IMG/publications/InterDB07-Ghawi.pdf [Архівовано 4 березня 2016 у Wayback Machine.]

[Li-7] Li et al. (2005) «A Semi-automatic Ontology Acquisition Method for the Semantic Web», WAIM, volume 3739 of Lecture Notes in Computer Science, page 209—220. Springer. http://dx.doi.org/10.1007/11563952_19 [Архівовано 26 липня 2008 у Wayback Machine.]

[Tirmizi-8] Tirmizi et al. (2008), «Translating SQL Applications to the Semantic Web», Lecture Notes in Computer Science, Volume 5181/2008 (Database and Expert Systems Applications). http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=15E8AB2A37BD06DAE59255A1AC3095F0?doi=10.1.1.140.3169&rep=rep1&type=pdf [Архівовано 4 березня 2016 у Wayback Machine.]

[Cerbah-9] Farid Cerbah (2008). «Learning Highly Structured Semantic Repositories from Relational Databases», The Semantic Web: Research and Applications, volume 5021 of Lecture Notes in Computer Science, Springer, Berlin / Heidelberg http://www.tao-project.eu/resources/publications/cerbah-learning-highly-structured-semantic-repositories-from-relational-databases.pdf [Архівовано 20 липня 2011 у Wayback Machine.]

[Wimalasuriya-10] Wimalasuriya, Daya C.; Dou, Dejing (2010). «Ontology-based information extraction: An introduction and a survey of current approaches», Journal of Information Science, 36(3), p. 306—323, http://ix.cs.uoregon.edu/~dou/research/papers/jis09.pdf [Архівовано 11 квітня 2016 у Wayback Machine.] (retrieved: 18.06.2012).

[Cunningham-11] Cunningham, Hamish (2005). «Information Extraction, Automatic», Encyclopedia of Language and Linguistics, 2, p. 665—677, http://gate.ac.uk/sale/ell2/ie/main.pdf [Архівовано 5 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).

[Erdmann-12] Erdmann, M.; Maedche, Alexander; Schnurr, H.-P.; Staab, Steffen (2000). «From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools», Proceedings of the COLING, http://www.ida.liu.se/ext/epa/cis/2001/002/paper.pdf [Архівовано 3 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).

[Rao-13] Rao, Delip; McNamee, Paul; Dredze, Mark (2011). «Entity Linking: Finding Extracted Entities in a Knowledge Base», Multi-source, Multi-lingual Information Extraction and Summarization, http://www.cs.jhu.edu/~delip/entity-linking.pdf^{[недоступне посилання з березня 2019]} (retrieved: 18.06.2012).

[Rocket-Software-Inc-14] Rocket Software, Inc. (2012). «technology for extracting intelligence from text», http://www.rocketsoftware.com/products/aerotext [Архівовано 21 червня 2013 у Wayback Machine.] (retrieved: 18.06.2012).

[Orchestr8-15] Orchestr8 (2012): «AlchemyAPI Overview», http://www.alchemyapi.com/api [Архівовано 1 серпня 2013 у Wayback Machine.] (retrieved: 18.06.2012).

[The-University-of-Sheffield-16] The University of Sheffield (2011). «ANNIE: a Nearly-New Information Extraction System», http://gate.ac.uk/sale/tao/splitch6.html#chap:annie [Архівовано 15 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).

[ILP-Network-of-Excellence-17] ILP Network of Excellence. «ASIUM (LRI)», http://www-ai.ijs.si/~ilpnet2/systems/asium.html [Архівовано 11 червня 2017 у Wayback Machine.] (retrieved: 18.06.2012).

[Attensity-18] Attensity (2012). «Exhaustive Extraction», http://www.attensity.com/products/technology/semantic-server/exhaustive-extraction/ [Архівовано 11 липня 2012 у Wayback Machine.] (retrieved: 18.06.2012).

[Mendes-19] Mendes, Pablo N.; Jakob, Max; Garcia-Sílva, Andrés; Bizer; Christian (2011). «DBpedia Spotlight: Shedding Light on the Web of Documents», Proceedings of the 7th International Conference on Semantic Systems, p. 1 — 8, http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/research/publications/Mendes-Jakob-GarciaSilva-Bizer-DBpediaSpotlight-ISEM2011.pdf [Архівовано 5 квітня 2012 у Wayback Machine.] (retrieved: 18.06.2012).

[Presutti-20] Presutti, Valentina; Draicchio, Francesco; Gangemi, Aldo (2012). «Knowledge Extraction based on Discourse Representation Theory and Linguistic Frames», «Proceedings of the Conference on Knowledge Engineering and Knowledge Management (EKAW2012), LNCS, Springer», http://www.researchgate.net/profile/Aldo_Gangemi/publication/262175193_Knowledge_extraction_based_on_discourse_representation_theory_and_linguistic_frames/links/5488b1bb0cf268d28f08fde6.pdf (retrieved: 18.01.2015).

[Balakrishna-21] Balakrishna, Mithun; Moldovan, Dan (2013). "Automatic Building of Semantically Rich Domain Models from Unstructured Data", Proceedings of the Twenty-Sixth International Florida Artificial Intelligence Research Society Conference (FLAIRS), p. 22 - 27, http://www.aaai.org/ocs/index.php/FLAIRS/FLAIRS13/paper/view/5909/6036 [Архівовано 4 березня 2016 у Wayback Machine.] (retrieved: 11.08.2014)

[Moldovan-22] 2. Moldovan, Dan; Blanco, Eduardo (2012). «Polaris: Lymba's Semantic Parser», Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC), p. 66 — 72, http://www.lrec-conf.org/proceedings/lrec2012/pdf/176_Paper.pdf [Архівовано 12 серпня 2014 у Wayback Machine.] (retrieved: 11.08.2014)

[Adrian-23] Adrian, Benjamin; Maus, Heiko; Dengel, Andreas (2009). «iDocument: Using Ontologies for Extracting Information from Text», http://www.dfki.uni-kl.de/~maus/dok/AdrianMausDengel09.pdf [Архівовано 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).

[SRA-International-Inc-24] SRA International, Inc. (2012). «NetOwl Extractor», http://www.sra.com/netowl/entity-extraction/ [Архівовано 24 вересня 2012 у Wayback Machine.] (retrieved: 18.06.2012).

[Fortuna-25] Fortuna, Blaz; Grobelnik, Marko; Mladenic, Dunja (2007). «OntoGen: Semi-automatic Ontology Editor», Proceedings of the 2007 conference on Human interface, Part 2, p. 309—318, http://analytics.ijs.si/~blazf/papers/OntoGen2_HCII2007.pdf [Архівовано 18 вересня 2013 у Wayback Machine.] (retrieved: 18.06.2012).

[Missikoff-26] Missikoff, Michele; Navigli, Roberto; Velardi, Paola (2002). «Integrated Approach to Web Ontology Learning and Engineering», Computer, 35(11), p. 60 — 63, http://wwwusers.di.uniroma1.it/~velardi/IEEE_C.pdf [Архівовано 19 травня 2017 у Wayback Machine.] (retrieved: 18.06.2012).

[McDowell-27] McDowell, Luke K.; Cafarella, Michael (2006). «Ontology-driven Information Extraction with OntoSyphon», Proceedings of the 5th international conference on The Semantic Web, p. 428—444, http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf [Архівовано 10 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).

[Yildiz-28] Yildiz, Burcu; Miksch, Silvia (2007). «ontoX — A Method for Ontology-Driven Information Extraction», Proceedings of the 2007 international conference on Computational science and its applications, 3, p. 660—673, http://publik.tuwien.ac.at/files/pub-inf_4769.pdf [Архівовано 5 липня 2017 у Wayback Machine.] (retrieved: 18.06.2012).

[semanticweb-org-29] semanticweb.org (2011). «PoolParty Extractor», http://semanticweb.org/wiki/PoolParty_Extractor [Архівовано 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).

[IMT_Holdings-30] IMT Holdings, Corp (2013). «Rosoka», http://www.rosoka.com/content/capabilities [Архівовано 10 травня 2016 у Wayback Machine.] (retrieved: 08.08.2013).

[Dill-31] Dill, Stephen; Eiron, Nadav; Gibson, David; Gruhl, Daniel; Guha, R.; Jhingran, Anant; Kanungo, Tapas; Rajagopalan, Sridhar; Tomkins, Andrew; Tomlin, John A.; Zien, Jason Y. (2003). «SemTag and Seeker: Bootstraping the Semantic Web via Automated Semantic Annotation», Proceedings of the 12th international conference on World Wide Web, p. 178—186, http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html [Архівовано 11 червня 2017 у Wayback Machine.] (retrieved: 18.06.2012).

[Uren-32] Uren, Victoria; Cimiano, Philipp; Iria, José; Handschuh, Siegfried; Vargas-Vera, Maria; Motta, Enrico; Ciravegna, Fabio (2006). «Semantic annotation for knowledge management: Requirements and a survey of the state of the art», Web Semantics: Science, Services and Agents on the World Wide Web, 4(1), p. 14 — 28, http://staffwww.dcs.shef.ac.uk/people/J.Iria/iria_jws06.pdf^{[недоступне посилання з травня 2019]}, (retrieved: 18.06.2012).

[Cimiano05-33] Cimiano, Philipp; Völker, Johanna (2005). «Text2Onto — A Framework for Ontology Learning and Data-Driven Change Discovery», Proceedings of the 10th International Conference of Applications of Natural Language to Information Systems, 3513, p. 227—238, http://www.cimiano.de/Publications/2005/nldb05/nldb05.pdf [Архівовано 14 травня 2013 у Wayback Machine.] (retrieved: 18.06.2012).

[Maedche-34] Maedche, Alexander; Volz, Raphael (2001). «The Ontology Extraction & Maintenance Framework Text-To-Onto», Proceedings of the IEEE International Conference on Data Mining, http://users.csc.calpoly.edu/~fkurfess/Events/DM-KM-01/Volz.pdf [Архівовано 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).

[Machine-Linking-35] Machine Linking. «We connect to the Linked Open Data cloud», http://thewikimachine.fbk.eu/html/index.html [Архівовано 19 липня 2012 у Wayback Machine.] (retrieved: 18.06.2012).

[Inxight-Federal-Systems-36] Inxight Federal Systems (2008). «Inxight ThingFinder and ThingFinder Professional», http://inxightfedsys.com/products/sdks/tf/ [Архівовано 29 червня 2012 у Wayback Machine.] (retrieved: 18.06.2012).

[Williams1992-37] Frawley William. F. et al. (1992), «Knowledge Discovery in Databases: An Overview», AI Magazine (Vol 13, No 3), 57-70 (online full version: http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1011 [Архівовано 4 березня 2016 у Wayback Machine.])

[Fayyad1996-38] Fayyad U. et al. (1996), «From Data Mining to Knowledge Discovery in Databases», AI Magazine (Vol 17, No 3), 37-54 (online full version: http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1230 [Архівовано 4 травня 2016 у Wayback Machine.]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

Видобування знань: відмінності між версіями

Версія за 10:34, 4 червня 2022

Зміст

Огляд

Приклади

Зв'язування об'єктів

Реляційні бази даних в RDF

Витяг з структурованих джерел в RDF

1: 1 Відображення з таблиць БД / Види на RDF Entities / Властивості / Значення

Складні відображення реляційних баз даних в RDF

XML

Огляд методів / Інструменти

Витяг з природних джерел мови

Традиційне вилучення інформації (IE)

Онтологія на основі вилучення інформації (OBIE)

Онтологія навчання (ОН)

Семантична анотація (SA)

інструменти

Виявлення знань

Вхідні дані

вихідні формати

Див. також

Примітки

Навігаційне меню

@@ Рядок 4: / Рядок 4: @@
 '''Видобування знань''' ({{lang-en|knowledge extraction}}, {{lang-ru|извлечение знаний}}) є створення [[Представлення знань|знань]] зі структурованих ([[Реляційна база даних|реляційних баз даних]], [[XML]]) і неструктурованих ([[текст]]и, документи, [[зображення]]) джерел. Отримане знання повинно бути збережене у форматі, придатному для автоматичного читання та інтерпретації. Також знання повинні бути представлені таким чином, щоб полегшити логічний [[висновок]]. Попри те, що це методично схоже на [[добування даних|видобування інформації]] ({{lang-en|Data Mining}}, [[обробка природної мови|NLP]]) і [[ETL]] (зберігання даних), основними критеріями є те, що результат видобування виходить за рамки створення структурованої інформації або перетворення її в [[Схема бази даних|реляційну схему]]. Це вимагає або повторного використання наявних [[Представлення знань|формальних знань]] (повторне використання ідентифікаторів або [[Онтологія (інформатика)|онтологій]]), або генерацію схеми{{що це}} на основі вихідних даних.
-Група RDB2RDF W3C<ref name="RDB2RDF">RDB2RDF Working Group, Website: http://www.w3.org/2001/sw/rdb2rdf/, charter: http://www.w3.org/2009/08/rdb2rdf-charter, R2RML: RDB to RDF Mapping Language: http://www.w3.org/TR/r2rml/</ref> в даний час{{коли}} стандартизує мову для видобутку [[Resource Description Framework|RDF]] ({{lang-en|Resource Description Framework}}) з реляційних баз даних. Ще одним популярним прикладом видобутку знань є перетворення Вікіпедії в [[Модель даних|структуровані дані]], а також відображення до наявних знань (див. [[DBpedia]] і [[Freebase]]).
+Група RDB2RDF W3C<ref name="RDB2RDF">RDB2RDF Working Group, Website: http://www.w3.org/2001/sw/rdb2rdf/ {{Webarchive|url=https://web.archive.org/web/20160511135603/http://www.w3.org/2001/sw/rdb2rdf/ |date=11 травня 2016 }}, charter: http://www.w3.org/2009/08/rdb2rdf-charter {{Webarchive|url=https://web.archive.org/web/20160320042046/http://www.w3.org/2009/08/rdb2rdf-charter |date=20 березня 2016 }}, R2RML: RDB to RDF Mapping Language: http://www.w3.org/TR/r2rml/ {{Webarchive|url=https://web.archive.org/web/20211010040010/http://www.w3.org/2001/sw/rdb2rdf/ |date=10 жовтня 2021 }}</ref> в даний час{{коли}} стандартизує мову для видобутку [[Resource Description Framework|RDF]] ({{lang-en|Resource Description Framework}}) з реляційних баз даних. Ще одним популярним прикладом видобутку знань є перетворення Вікіпедії в [[Модель даних|структуровані дані]], а також відображення до наявних знань (див. [[DBpedia]] і [[Freebase]]).
 == Огляд ==
@@ Рядок 34: / Рядок 34: @@
 === Зв'язування об'єктів ===
-# [[DBpedia|DBpedia Spotlight]], {{Нп|OpenCalais|||Calais (Reuters product)}}, [http://dandelion.eu/datatxt/ Dandelion dataTXT]{{Недоступне посилання}}, Zemanta API, [http://www.extractiv.com/demo.html Extractiv] та [http://poolparty.biz/products/poolparty-extractor/ PoolParty Extractor] аналізують  вільний текст через [[розпізнавання іменованих сутностей]], а потім усуває неоднозначність кандидатів через {{Нп|розпізнавання імен|||Name resolution (semantics and text extraction)}} та пов'язує знайдені об'єкти зі сховищем знань DBpedia<ref name="OpenCalaisLinkedData"/> (див. демо Dandelion dataTXT, DBpedia Spotlight або PoolParty Extractor).
+# [[DBpedia|DBpedia Spotlight]], {{Нп|OpenCalais|||Calais (Reuters product)}}, [http://dandelion.eu/datatxt/ Dandelion dataTXT]{{Недоступне посилання}}, Zemanta API, [http://www.extractiv.com/demo.html Extractiv] {{Webarchive|url=https://web.archive.org/web/20170329174312/http://extractiv.com/demo.html |date=29 березня 2017 }} та [http://poolparty.biz/products/poolparty-extractor/ PoolParty Extractor] {{Webarchive|url=https://web.archive.org/web/20120626221901/http://poolparty.biz/products/poolparty-extractor/ |date=26 червня 2012 }} аналізують  вільний текст через [[розпізнавання іменованих сутностей]], а потім усуває неоднозначність кандидатів через {{Нп|розпізнавання імен|||Name resolution (semantics and text extraction)}} та пов'язує знайдені об'єкти зі сховищем знань DBpedia<ref name="OpenCalaisLinkedData"/> (див. демо Dandelion dataTXT, DBpedia Spotlight або PoolParty Extractor).
-<blockquote>[http://dbpedia.org/resource/Barack_Obama Президент Обама] у середу закликав [http://dbpedia.org/resource/United_States_Congress Конгрес] продовжити податкові пільги для студентів, включених до економічних стимулів у минулому році, стверджуючи, що політика забезпечує більш щедру допомогу.
+<blockquote>[http://dbpedia.org/resource/Barack_Obama Президент Обама] {{Webarchive|url=https://web.archive.org/web/20081012051834/http://dbpedia.org/resource/Barack_Obama |date=12 жовтня 2008 }} у середу закликав [http://dbpedia.org/resource/United_States_Congress Конгрес] продовжити податкові пільги для студентів, включених до економічних стимулів у минулому році, стверджуючи, що політика забезпечує більш щедру допомогу.
 </blockquote>
 : Як президент Обама пов'язаний з ресурсом DBpedia {{Нп|Linked data|||}}, додаткова інформація може бути отримана автоматично і {{Нп|Semantic Reasoner|||}} може, наприклад, зробити висновок, що згадана особа має тип особи (з використанням [[FOAF]] (програмне забезпечення)) і президентів типу Сполучених Штатів (за допомогою {{Нп|YAGO|||YAGO (database)}}). Приклади: Методи, які розпізнають тільки об'єкти або посилання на статті Вікіпедії та інших цілей, які не забезпечують подальше вилучення структурованих даних і формальних знань.
@@ Рядок 104: / Рядок 104: @@
 ! Uses GUI
 |-
-| [http://www.w3.org/TR/rdb-direct-mapping/ A Direct Mapping of Relational Data to RDF]
+| [http://www.w3.org/TR/rdb-direct-mapping/ A Direct Mapping of Relational Data to RDF] {{Webarchive|url=https://web.archive.org/web/20160509074334/http://www.w3.org/TR/rdb-direct-mapping/ |date=9 травня 2016 }}
 |  Relational Data
 | SPARQL/ETL
@@ Рядок 114: / Рядок 114: @@
 | false
 |-
-| [http://logd.tw.rpi.edu/technology/csv2rdf4lod CSV2RDF4LOD]
+| [http://logd.tw.rpi.edu/technology/csv2rdf4lod CSV2RDF4LOD] {{Webarchive|url=https://web.archive.org/web/20160822161013/https://logd.tw.rpi.edu/technology/csv2rdf4lod |date=22 серпня 2016 }}
 |  CSV
 |  ETL
@@ Рядок 124: / Рядок 124: @@
 |  false
 |-
-| [http://www.mindswap.org/~mhgrove/ConvertToRDF/ Convert2RDF]
+| [http://www.mindswap.org/~mhgrove/ConvertToRDF/ Convert2RDF] {{Webarchive|url=https://web.archive.org/web/20160922194950/http://www.mindswap.org/~mhgrove/ConvertToRDF/ |date=22 вересня 2016 }}
 |  Delimited text file
 |  ETL
@@ Рядок 154: / Рядок 154: @@
 |  true
 |-
-| [http://protegewiki.stanford.edu/wiki/DataMaster DataMaster]
+| [http://protegewiki.stanford.edu/wiki/DataMaster DataMaster] {{Webarchive|url=https://web.archive.org/web/20160521024110/http://protegewiki.stanford.edu/wiki/DataMaster |date=21 травня 2016 }}
 |  RDB
 |  ETL
@@ Рядок 183: / Рядок 183: @@
 |  false
 |-
-| [http://www.cs.toronto.edu/semanticweb/maponto/ MAPONTO]
+| [http://www.cs.toronto.edu/semanticweb/maponto/ MAPONTO] {{Webarchive|url=https://web.archive.org/web/20160602122154/http://www.cs.toronto.edu/semanticweb/maponto/ |date=2 червня 2016 }}
 |  RDB
 |  ETL
@@ Рядок 193: / Рядок 193: @@
 |  false
 |-
-| [http://metamorphoses.sourceforge.net/ METAmorphoses]
+| [http://metamorphoses.sourceforge.net/ METAmorphoses] {{Webarchive|url=https://web.archive.org/web/20160417074604/http://metamorphoses.sourceforge.net/ |date=17 квітня 2016 }}
 |  RDB
 |  ETL
@@ Рядок 233: / Рядок 233: @@
 |  true
 |-
-| [http://poolparty.biz/products/poolparty-extractor/ Poolparty Extraktor (PPX)]
+| [http://poolparty.biz/products/poolparty-extractor/ Poolparty Extraktor (PPX)] {{Webarchive|url=https://web.archive.org/web/20120626221901/http://poolparty.biz/products/poolparty-extractor/ |date=26 червня 2012 }}
 |  XML, Text
 |  LinkedData
@@ Рядок 253: / Рядок 253: @@
 |  true
 |-
-| [http://ebiquity.umbc.edu/project/html/id/82/RDF123 RDF 123]
+| [http://ebiquity.umbc.edu/project/html/id/82/RDF123 RDF 123] {{Webarchive|url=https://web.archive.org/web/20110720085816/http://ebiquity.umbc.edu/project/html/id/82/RDF123 |date=20 липня 2011 }}
 |  CSV
 |  ETL
@@ Рядок 283: / Рядок 283: @@
 |  false
 |-
-| [http://ebiquity.umbc.edu/paper/html/id/480/T2LD-An-automatic-framework-for-extracting-interpreting-and-representing-tables-as-Linked-Data T2LD]
+| [http://ebiquity.umbc.edu/paper/html/id/480/T2LD-An-automatic-framework-for-extracting-interpreting-and-representing-tables-as-Linked-Data T2LD] {{Webarchive|url=https://web.archive.org/web/20110720085821/http://ebiquity.umbc.edu/paper/html/id/480/T2LD-An-automatic-framework-for-extracting-interpreting-and-representing-tables-as-Linked-Data |date=20 липня 2011 }}
 |  CSV
 |  ETL
@@ Рядок 330: / Рядок 330: @@
 |  true
 |-
-| [http://virtuoso.openlinksw.com Virtuoso RDF Views]
+| [http://virtuoso.openlinksw.com Virtuoso RDF Views] {{Webarchive|url=https://web.archive.org/web/20140905210159/http://virtuoso.openlinksw.com/ |date=5 вересня 2014 }}
 |  RDB
 |  SPARQL
@@ Рядок 340: / Рядок 340: @@
 |  true
 |-
-| [http://virtuoso.openlinksw.com Virtuoso Sponger]
+| [http://virtuoso.openlinksw.com Virtuoso Sponger] {{Webarchive|url=https://web.archive.org/web/20140905210159/http://virtuoso.openlinksw.com/ |date=5 вересня 2014 }}
 |  structured and semi-structured data sources
 |  SPARQL
@@ Рядок 360: / Рядок 360: @@
 |  true
 |-
-| [http://xlwrap.sourceforge.net/ XLWrap: Spreadsheet to RDF]
+| [http://xlwrap.sourceforge.net/ XLWrap: Spreadsheet to RDF] {{Webarchive|url=https://web.archive.org/web/20160508192031/http://xlwrap.sourceforge.net/ |date=8 травня 2016 }}
 |  CSV
 |  ETL
@@ Рядок 370: / Рядок 370: @@
 |  false
 |-
-| [http://rhizomik.net/html/redefer/#XML2RDF XML to RDF]
+| [http://rhizomik.net/html/redefer/#XML2RDF XML to RDF] {{Webarchive|url=https://web.archive.org/web/20160511151238/http://rhizomik.net/html/redefer/#XML2RDF |date=11 травня 2016 }}
 |  XML
 |  ETL
@@ Рядок 491: / Рядок 491: @@
 | English, Spanish, Arabic, Chinese, indonesian
 |-
-| [http://www.alchemyapi.com/api AlchemyAPI]<ref name="Orchestr8">Orchestr8 (2012): «AlchemyAPI Overview», http://www.alchemyapi.com/api (retrieved: 18.06.2012).</ref>
+| [http://www.alchemyapi.com/api AlchemyAPI] {{Webarchive|url=https://web.archive.org/web/20130801170506/http://www.alchemyapi.com/api/lang |date=1 серпня 2013 }}<ref name="Orchestr8">Orchestr8 (2012): «AlchemyAPI Overview», http://www.alchemyapi.com/api {{Webarchive|url=https://web.archive.org/web/20130801170506/http://www.alchemyapi.com/api/lang |date=1 серпня 2013 }} (retrieved: 18.06.2012).</ref>
 | plain text, HTML
 | automatic
@@ Рядок 498: / Рядок 498: @@
 | multilingual
 |-
-| [http://gate.ac.uk/sale/tao/splitch6.html#chap:annie ANNIE]<ref name="The-University-of-Sheffield"/>
+| [http://gate.ac.uk/sale/tao/splitch6.html#chap:annie ANNIE] {{Webarchive|url=https://web.archive.org/web/20160315122846/https://gate.ac.uk/sale/tao/splitch6.html#chap:annie |date=15 березня 2016 }}<ref name="The-University-of-Sheffield"/>
 | plain text
 | dump
@@ Рядок 507: / Рядок 507: @@
 | multilingual
 |-
-| [http://www-ai.ijs.si/~ilpnet2/systems/asium.html ASIUM]<ref name="ILP-Network-of-Excellence"/>
+| [http://www-ai.ijs.si/~ilpnet2/systems/asium.html ASIUM] {{Webarchive|url=https://web.archive.org/web/20170611085156/http://www-ai.ijs.si/~ilpnet2/systems/asium.html |date=11 червня 2017 }}<ref name="ILP-Network-of-Excellence"/>
 | plain text
 | dump
@@ Рядок 522: / Рядок 522: @@
 | NLP
 |-
-| [https://dandelion.eu/ Dandelion API]
+| [https://dandelion.eu/ Dandelion API] {{Webarchive|url=https://web.archive.org/web/20160528141719/https://dandelion.eu/ |date=28 травня 2016 }}
 | plain text, HTML, URL
 | REST
@@ Рядок 552: / Рядок 552: @@
 | English
 |-
-| [http://entityclassifier.eu EntityClassifier.eu]
+| [http://entityclassifier.eu EntityClassifier.eu] {{Webarchive|url=https://web.archive.org/web/20160303233958/https://entityclassifier.eu/ |date=3 березня 2016 }}
 | plain text, HTML
 | dump
@@ Рядок 567: / Рядок 567: @@
 | English, German, Dutch
 |-
-| [http://wit.istc.cnr.it/stlab-tools/fred FRED]<ref name="Presutti"/>
+| [http://wit.istc.cnr.it/stlab-tools/fred FRED] {{Webarchive|url=https://web.archive.org/web/20160508182429/http://wit.istc.cnr.it/stlab-tools/fred |date=8 травня 2016 }}<ref name="Presutti"/>
-|  plain text, PDF and Word via [http://wit.istc.cnr.it/stlab-tools/sheldon Sheldon]
+|  plain text, PDF and Word via [http://wit.istc.cnr.it/stlab-tools/sheldon Sheldon] {{Webarchive|url=https://web.archive.org/web/20160520232149/http://wit.istc.cnr.it/stlab-tools/sheldon/ |date=20 травня 2016 }}
 |  dump, REST
 |  yes
@@ Рядок 575: / Рядок 575: @@
 |  yes
 |  OL+IE+SA
-| concepts, concept hierarchy, frames, events, relationships, named entities, negation, modality, tense, entity linking, schema alignment, sentiment (via [http://wit.istc.cnr.it/stlab-tools/sentilo Sentilo])
+| concepts, concept hierarchy, frames, events, relationships, named entities, negation, modality, tense, entity linking, schema alignment, sentiment (via [http://wit.istc.cnr.it/stlab-tools/sentilo Sentilo] {{Webarchive|url=https://web.archive.org/web/20160618104722/http://wit.istc.cnr.it/stlab-tools/sentilo/ |date=18 червня 2016 }})
 | NLP, SPARQL, heuristical rules, ontology design patterns
 | RDF-OWL, Turtle, NT, JSON-LD, DAG, diagrams
@@ Рядок 596: / Рядок 596: @@
 | English, Spanish
 |-
-| [http://idocument.opendfki.de iDocument]<ref name="Adrian">Adrian, Benjamin; Maus, Heiko; Dengel, Andreas (2009). «iDocument: Using Ontologies for Extracting Information from Text», http://www.dfki.uni-kl.de/~maus/dok/AdrianMausDengel09.pdf (retrieved: 18.06.2012).</ref>
+| [http://idocument.opendfki.de iDocument] {{Webarchive|url=https://web.archive.org/web/20210621120712/http://idocument.opendfki.de/ |date=21 червня 2021 }}<ref name="Adrian">Adrian, Benjamin; Maus, Heiko; Dengel, Andreas (2009). «iDocument: Using Ontologies for Extracting Information from Text», http://www.dfki.uni-kl.de/~maus/dok/AdrianMausDengel09.pdf {{Webarchive|url=https://web.archive.org/web/20160304042501/http://www.dfki.uni-kl.de/~maus/dok/AdrianMausDengel09.pdf |date=4 березня 2016 }} (retrieved: 18.06.2012).</ref>
 | HTML, PDF, DOC
 | SPARQL
@@ Рядок 606: / Рядок 606: @@
 | personal, business
 |-
-| [http://www.netowl.com/ NetOwl Extractor]<ref name="SRA-International-Inc"/>
+| [http://www.netowl.com/ NetOwl Extractor] {{Webarchive|url=https://web.archive.org/web/20160409053833/https://www.netowl.com/ |date=9 квітня 2016 }}<ref name="SRA-International-Inc"/>
 | plain text, HTML, XML, SGML, PDF, MS Office
 | dump
@@ Рядок 628: / Рядок 628: @@
 | NLP, machine learning, clustering
 |-
-| [http://wwwusers.di.uniroma1.it/~velardi/CL.pdf OntoLearn] {{Webarchive|url=https://web.archive.org/web/20170809104810/http://wwwusers.di.uniroma1.it/~velardi/CL.pdf |date=9 серпня 2017 }}<ref name="Missikoff"/>
+| [http://wwwusers.di.uniroma1.it/~velardi/CL.pdf OntoLearn] {{Webarchive|url=https://web.archive.org/web/20170809104810/http://wwwusers.di.uniroma1.it/~velardi/CL.pdf |date=9 серпня 2017 }} {{Webarchive|url=https://web.archive.org/web/20170809104810/http://wwwusers.di.uniroma1.it/~velardi/CL.pdf |date=9 серпня 2017 }}<ref name="Missikoff"/>
 | plain text, HTML
 | dump
@@ Рядок 643: / Рядок 643: @@
 | English
 |-
-| [http://wwwusers.di.uniroma1.it/~navigli/pubs/IJCAI_2011_Navigli_Velardi_Faralli.pdf OntoLearn Reloaded]
+| [http://wwwusers.di.uniroma1.it/~navigli/pubs/IJCAI_2011_Navigli_Velardi_Faralli.pdf OntoLearn Reloaded] {{Webarchive|url=https://web.archive.org/web/20160304032408/http://wwwusers.di.uniroma1.it/~navigli/pubs/IJCAI_2011_Navigli_Velardi_Faralli.pdf |date=4 березня 2016 }}
 | plain text, HTML
 | dump
@@ Рядок 658: / Рядок 658: @@
 | English
 |-
-| [http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf OntoSyphon]<ref name="McDowell"/>
+| [http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf OntoSyphon] {{Webarchive|url=https://web.archive.org/web/20160310145723/http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf |date=10 березня 2016 }}<ref name="McDowell"/>
 | HTML, PDF, DOC
 | dump, search engine queries
@@ Рядок 673: / Рядок 673: @@
 | English
 |-
-| [http://ieg.ifs.tuwien.ac.at/projects/ontox ontoX] {{Webarchive|url=https://web.archive.org/web/20160527000719/http://ieg.ifs.tuwien.ac.at/projects/ontox/ |date=27 травня 2016 }}<ref name="Yildiz">Yildiz, Burcu; Miksch, Silvia (2007). «ontoX&nbsp;— A Method for Ontology-Driven Information Extraction», ''Proceedings of the 2007 international conference on Computational science and its applications'', 3, p. 660—673, http://publik.tuwien.ac.at/files/pub-inf_4769.pdf (retrieved: 18.06.2012).</ref>
+| [http://ieg.ifs.tuwien.ac.at/projects/ontox ontoX] {{Webarchive|url=https://web.archive.org/web/20160527000719/http://ieg.ifs.tuwien.ac.at/projects/ontox/ |date=27 травня 2016 }}<ref name="Yildiz">Yildiz, Burcu; Miksch, Silvia (2007). «ontoX&nbsp;— A Method for Ontology-Driven Information Extraction», ''Proceedings of the 2007 international conference on Computational science and its applications'', 3, p. 660—673, http://publik.tuwien.ac.at/files/pub-inf_4769.pdf {{Webarchive|url=https://web.archive.org/web/20170705135417/https://publik.tuwien.ac.at/files/pub-inf_4769.pdf |date=5 липня 2017 }} (retrieved: 18.06.2012).</ref>
 | plain text
 | dump
@@ Рядок 688: / Рядок 688: @@
 | language-independent
 |-
-| [http://www.opencalais.com/ OpenCalais]
+| [http://www.opencalais.com/ OpenCalais] {{Webarchive|url=https://web.archive.org/web/20081024201531/http://www.opencalais.com/ |date=24 жовтня 2008 }}
 | plain text, HTML, XML
 | dump
@@ Рядок 703: / Рядок 703: @@
 | English, French, Spanish
 |-
-| [http://www.semantic-web.at/de/poolparty-extractor PoolParty Extractor]<ref name="semanticweb-org"/>
+| [http://www.semantic-web.at/de/poolparty-extractor PoolParty Extractor] {{Webarchive|url=https://web.archive.org/web/20160517122625/http://www.semantic-web.at/de/poolparty-extractor |date=17 травня 2016 }}<ref name="semanticweb-org"/>
 | plain text, HTML, DOC, ODT
 | dump
@@ Рядок 718: / Рядок 718: @@
 | English, German, Spanish, French
 |-
-| [http://www.rosoka.com/ Rosoka]<ref name="IMT Holdings"/>
+| [http://www.rosoka.com/ Rosoka] {{Webarchive|url=https://web.archive.org/web/20160510052622/http://www.rosoka.com/ |date=10 травня 2016 }}<ref name="IMT Holdings"/>
 | plain text, HTML, XML, SGML, PDF, MS Office
 | dump
@@ Рядок 733: / Рядок 733: @@
 | Multilingual (230)
 |-
-| [https://github.com/benjamin-adrian/scoobie SCOOBIE]
+| [https://github.com/benjamin-adrian/scoobie SCOOBIE] {{Webarchive|url=https://web.archive.org/web/20180611021208/https://github.com/benjamin-adrian/scoobie |date=11 червня 2018 }}
 | plain text, HTML
 | dump
@@ Рядок 748: / Рядок 748: @@
 | English, German
 |-
-| [http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html SemTag]<ref name="Dill"/><ref name="Uren"/>
+| [http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html SemTag] {{Webarchive|url=https://web.archive.org/web/20170611141931/http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html |date=11 червня 2017 }}<ref name="Dill"/><ref name="Uren"/>
 | HTML
 | dump
@@ Рядок 777: / Рядок 777: @@
 | English, German, French, Dutch, polish
 |-
-| [http://code.google.com/p/text2onto/ Text2Onto]<ref name="Cimiano05"/>
+| [http://code.google.com/p/text2onto/ Text2Onto] {{Webarchive|url=https://web.archive.org/web/20160502010552/https://code.google.com/p/text2onto/ |date=2 травня 2016 }}<ref name="Cimiano05"/>
 | plain text, HTML, PDF
 | dump
@@ Рядок 792: / Рядок 792: @@
 | English, German, Spanish
 |-
-| [http://texttoonto.sourceforge.net/ Text-To-Onto]<ref name="Maedche"/>
+| [http://texttoonto.sourceforge.net/ Text-To-Onto] {{Webarchive|url=https://web.archive.org/web/20130515070046/http://texttoonto.sourceforge.net/ |date=15 травня 2013 }}<ref name="Maedche"/>
 | plain text, HTML, PDF, PostScript
 | dump
@@ Рядок 803: / Рядок 803: @@
 | German
 |-
-|[http://www.thatneedle.com/nlp-api.html ThatNeedle]
+|[http://www.thatneedle.com/nlp-api.html ThatNeedle] {{Webarchive|url=https://web.archive.org/web/20160513102654/http://www.thatneedle.com/nlp-api.html |date=13 травня 2016 }}
 |Plain Text
 |dump
@@ Рядок 891: / Рядок 891: @@
 == Примітки ==
 {{reflist|2|refs=
-<ref name="Balakrishna">Balakrishna, Mithun; Moldovan, Dan (2013). "Automatic Building of Semantically Rich Domain Models from Unstructured Data", Proceedings of the Twenty-Sixth International Florida Artificial Intelligence Research Society Conference (FLAIRS), p. 22 - 27, http://www.aaai.org/ocs/index.php/FLAIRS/FLAIRS13/paper/view/5909/6036 (retrieved: 11.08.2014)</ref>
+<ref name="Balakrishna">Balakrishna, Mithun; Moldovan, Dan (2013). "Automatic Building of Semantically Rich Domain Models from Unstructured Data", Proceedings of the Twenty-Sixth International Florida Artificial Intelligence Research Society Conference (FLAIRS), p. 22 - 27, http://www.aaai.org/ocs/index.php/FLAIRS/FLAIRS13/paper/view/5909/6036 {{Webarchive|url=https://web.archive.org/web/20160304055432/http://www.aaai.org/ocs/index.php/FLAIRS/FLAIRS13/paper/view/5909/6036 |date=4 березня 2016 }} (retrieved: 11.08.2014)</ref>
 <ref name="OpenCalaisLinkedData">{{cite web |url=http://www.opencalais.com/node/9501 |title=Life in the Linked Data Cloud |publisher=www.opencalais.com |accessdate=2009-11-10 |quote=Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format. |archiveurl=https://web.archive.org/web/20091124182935/http://www.opencalais.com/node/9501 |archivedate=2009-11-24 |deadurl=yes }}</ref>
 <ref name="RDB2RDF">RDB2RDF Working Group, Website: http://www.w3.org/2001/sw/rdb2rdf/ , charter: http://www.w3.org/2009/08/rdb2rdf-charter, R2RML: RDB to RDF Mapping Language: http://www.w3.org/TR/r2rml/</ref>
@@ Рядок 897: / Рядок 897: @@
 <ref name="Williams1992" >Frawley William. F. et al. (1992), «Knowledge Discovery in Databases: An Overview», ''AI Magazine'' (Vol 13, No 3), 57-70 (online full version: http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1011 {{Webarchive|url=https://web.archive.org/web/20160304054249/http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1011 |date=4 березня 2016 }})</ref>
 <ref name="Fayyad1996"/>
-<ref name="timbl_reldb4semweb">Tim Berners-Lee (1998), [http://www.w3.org/DesignIssues/RDB-RDF.html «Relational Databases on the Semantic Web»]. Retrieved: February 20, 2011.</ref>
+<ref name="timbl_reldb4semweb">Tim Berners-Lee (1998), [http://www.w3.org/DesignIssues/RDB-RDF.html «Relational Databases on the Semantic Web»] {{Webarchive|url=https://web.archive.org/web/20160316133346/http://www.w3.org/DesignIssues/RDB-RDF.html |date=16 березня 2016 }}. Retrieved: February 20, 2011.</ref>
 <ref name="Cerbah">Farid Cerbah (2008). «Learning Highly Structured Semantic Repositories from Relational Databases», The Semantic Web: Research and Applications, volume 5021 of Lecture Notes in Computer Science, Springer, Berlin / Heidelberg http://www.tao-project.eu/resources/publications/cerbah-learning-highly-structured-semantic-repositories-from-relational-databases.pdf {{Webarchive|url=https://web.archive.org/web/20110720172603/http://www.tao-project.eu/resources/publications/cerbah-learning-highly-structured-semantic-repositories-from-relational-databases.pdf |date=20 липня 2011 }}</ref>
-<ref name="Tirmizi" >Tirmizi et al. (2008), «Translating SQL Applications to the Semantic Web», Lecture Notes in Computer Science, Volume 5181/2008 (Database and Expert Systems Applications). http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=15E8AB2A37BD06DAE59255A1AC3095F0?doi=10.1.1.140.3169&rep=rep1&type=pdf</ref>
+<ref name="Tirmizi" >Tirmizi et al. (2008), «Translating SQL Applications to the Semantic Web», Lecture Notes in Computer Science, Volume 5181/2008 (Database and Expert Systems Applications). http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=15E8AB2A37BD06DAE59255A1AC3095F0?doi=10.1.1.140.3169&rep=rep1&type=pdf {{Webarchive|url=https://web.archive.org/web/20160304094334/http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=15E8AB2A37BD06DAE59255A1AC3095F0?doi=10.1.1.140.3169&rep=rep1&type=pdf |date=4 березня 2016 }}</ref>
-<ref name="Hu">Hu et al. (2007), «Discovering Simple Mappings Between Relational Database Schemas and Ontologies», In Proc. of 6th International Semantic Web Conference (ISWC 2007), 2nd Asian Semantic Web Conference (ASWC 2007), LNCS 4825, pages 225‐238, Busan, Korea, 11‐15 November 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.6934&rep=rep1&type=pdf</ref>
+<ref name="Hu">Hu et al. (2007), «Discovering Simple Mappings Between Relational Database Schemas and Ontologies», In Proc. of 6th International Semantic Web Conference (ISWC 2007), 2nd Asian Semantic Web Conference (ASWC 2007), LNCS 4825, pages 225‐238, Busan, Korea, 11‐15 November 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.6934&rep=rep1&type=pdf {{Webarchive|url=https://web.archive.org/web/20121015211410/http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.6934&rep=rep1&type=pdf |date=15 жовтня 2012 }}</ref>
-<ref name="Ghawi" >R. Ghawi and N. Cullot (2007), «Database-to-Ontology Mapping Generation for Semantic Interoperability». In Third International Workshop on Database Interoperability (InterDB 2007). http://le2i.cnrs.fr/IMG/publications/InterDB07-Ghawi.pdf</ref>
+<ref name="Ghawi" >R. Ghawi and N. Cullot (2007), «Database-to-Ontology Mapping Generation for Semantic Interoperability». In Third International Workshop on Database Interoperability (InterDB 2007). http://le2i.cnrs.fr/IMG/publications/InterDB07-Ghawi.pdf {{Webarchive|url=https://web.archive.org/web/20160304104551/http://le2i.cnrs.fr/IMG/publications/InterDB07-Ghawi.pdf |date=4 березня 2016 }}</ref>
-<ref name="Li" >Li et al. (2005) «A Semi-automatic Ontology Acquisition Method for the Semantic Web», WAIM, volume 3739 of Lecture Notes in Computer Science, page 209—220. Springer. http://dx.doi.org/10.1007/11563952_19</ref>
+<ref name="Li" >Li et al. (2005) «A Semi-automatic Ontology Acquisition Method for the Semantic Web», WAIM, volume 3739 of Lecture Notes in Computer Science, page 209—220. Springer. http://dx.doi.org/10.1007/11563952_19 {{Webarchive|url=https://web.archive.org/web/20080726001542/http://dx.doi.org/10.1007/11563952_19 |date=26 липня 2008 }}</ref>
 <ref name="Adrian"/>
 <ref name="Attensity">Attensity (2012). «Exhaustive Extraction», http://www.attensity.com/products/technology/semantic-server/exhaustive-extraction/ {{Webarchive|url=https://web.archive.org/web/20120711232021/http://www.attensity.com/products/technology/semantic-server/exhaustive-extraction/ |date=11 липня 2012 }} (retrieved: 18.06.2012).</ref>
-<ref name="Cimiano05">Cimiano, Philipp; Völker, Johanna (2005). «Text2Onto&nbsp;— A Framework for Ontology Learning and Data-Driven Change Discovery», ''Proceedings of the 10th International Conference of Applications of Natural Language to Information Systems'', 3513, p. 227—238, http://www.cimiano.de/Publications/2005/nldb05/nldb05.pdf (retrieved: 18.06.2012).</ref>
+<ref name="Cimiano05">Cimiano, Philipp; Völker, Johanna (2005). «Text2Onto&nbsp;— A Framework for Ontology Learning and Data-Driven Change Discovery», ''Proceedings of the 10th International Conference of Applications of Natural Language to Information Systems'', 3513, p. 227—238, http://www.cimiano.de/Publications/2005/nldb05/nldb05.pdf {{Webarchive|url=https://web.archive.org/web/20130514061357/http://www.cimiano.de/Publications/2005/nldb05/nldb05.pdf |date=14 травня 2013 }} (retrieved: 18.06.2012).</ref>
-<ref name="Cunningham">Cunningham, Hamish (2005). «Information Extraction, Automatic», ''Encyclopedia of Language and Linguistics'', 2, p. 665—677, http://gate.ac.uk/sale/ell2/ie/main.pdf (retrieved: 18.06.2012).</ref>
+<ref name="Cunningham">Cunningham, Hamish (2005). «Information Extraction, Automatic», ''Encyclopedia of Language and Linguistics'', 2, p. 665—677, http://gate.ac.uk/sale/ell2/ie/main.pdf {{Webarchive|url=https://web.archive.org/web/20160305145951/https://gate.ac.uk/sale/ell2/ie/main.pdf |date=5 березня 2016 }} (retrieved: 18.06.2012).</ref>
-<ref name="Dill">Dill, Stephen; Eiron, Nadav; Gibson, David; Gruhl, Daniel; Guha, R.; Jhingran, Anant; Kanungo, Tapas; Rajagopalan, Sridhar; Tomkins, Andrew; Tomlin, John A.; Zien, Jason Y. (2003). «SemTag and Seeker: Bootstraping the Semantic Web via Automated Semantic Annotation», ''Proceedings of the 12th international conference on World Wide Web'', p. 178—186, http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html (retrieved: 18.06.2012).</ref>
+<ref name="Dill">Dill, Stephen; Eiron, Nadav; Gibson, David; Gruhl, Daniel; Guha, R.; Jhingran, Anant; Kanungo, Tapas; Rajagopalan, Sridhar; Tomkins, Andrew; Tomlin, John A.; Zien, Jason Y. (2003). «SemTag and Seeker: Bootstraping the Semantic Web via Automated Semantic Annotation», ''Proceedings of the 12th international conference on World Wide Web'', p. 178—186, http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html {{Webarchive|url=https://web.archive.org/web/20170611141931/http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html |date=11 червня 2017 }} (retrieved: 18.06.2012).</ref>
-<ref name="Erdmann">Erdmann, M.; Maedche, Alexander; Schnurr, H.-P.; Staab, Steffen (2000). «From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools», ''Proceedings of the COLING'', http://www.ida.liu.se/ext/epa/cis/2001/002/paper.pdf (retrieved: 18.06.2012).</ref>
+<ref name="Erdmann">Erdmann, M.; Maedche, Alexander; Schnurr, H.-P.; Staab, Steffen (2000). «From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools», ''Proceedings of the COLING'', http://www.ida.liu.se/ext/epa/cis/2001/002/paper.pdf {{Webarchive|url=https://web.archive.org/web/20160303205012/http://www.ida.liu.se/ext/epa/cis/2001/002/paper.pdf |date=3 березня 2016 }} (retrieved: 18.06.2012).</ref>
-<ref name="Fortuna">Fortuna, Blaz; Grobelnik, Marko; Mladenic, Dunja (2007). «OntoGen: Semi-automatic Ontology Editor», ''Proceedings of the 2007 conference on Human interface, Part 2'', p. 309—318, http://analytics.ijs.si/~blazf/papers/OntoGen2_HCII2007.pdf (retrieved: 18.06.2012).</ref>
+<ref name="Fortuna">Fortuna, Blaz; Grobelnik, Marko; Mladenic, Dunja (2007). «OntoGen: Semi-automatic Ontology Editor», ''Proceedings of the 2007 conference on Human interface, Part 2'', p. 309—318, http://analytics.ijs.si/~blazf/papers/OntoGen2_HCII2007.pdf {{Webarchive|url=https://web.archive.org/web/20130918152126/http://analytics.ijs.si/~blazf/papers/OntoGen2_HCII2007.pdf |date=18 вересня 2013 }} (retrieved: 18.06.2012).</ref>
-<ref name="ILP-Network-of-Excellence">ILP Network of Excellence. «ASIUM (LRI)», http://www-ai.ijs.si/~ilpnet2/systems/asium.html (retrieved: 18.06.2012).</ref>
+<ref name="ILP-Network-of-Excellence">ILP Network of Excellence. «ASIUM (LRI)», http://www-ai.ijs.si/~ilpnet2/systems/asium.html {{Webarchive|url=https://web.archive.org/web/20170611085156/http://www-ai.ijs.si/~ilpnet2/systems/asium.html |date=11 червня 2017 }} (retrieved: 18.06.2012).</ref>
 <ref name="Inxight-Federal-Systems">Inxight Federal Systems (2008). «Inxight ThingFinder and ThingFinder Professional», http://inxightfedsys.com/products/sdks/tf/ {{Webarchive|url=https://web.archive.org/web/20120629052702/http://inxightfedsys.com/products/sdks/tf/ |date=29 червня 2012 }} (retrieved: 18.06.2012).</ref>
 <ref name="Machine-Linking">Machine Linking. «We connect to the Linked Open Data cloud», http://thewikimachine.fbk.eu/html/index.html {{Webarchive|url=https://web.archive.org/web/20120719171047/http://thewikimachine.fbk.eu/html/index.html |date=19 липня 2012 }} (retrieved: 18.06.2012).</ref>
-<ref name="Maedche">Maedche, Alexander; Volz, Raphael (2001). «The Ontology Extraction & Maintenance Framework Text-To-Onto», ''Proceedings of the IEEE International Conference on Data Mining'', http://users.csc.calpoly.edu/~fkurfess/Events/DM-KM-01/Volz.pdf (retrieved: 18.06.2012).</ref>
+<ref name="Maedche">Maedche, Alexander; Volz, Raphael (2001). «The Ontology Extraction & Maintenance Framework Text-To-Onto», ''Proceedings of the IEEE International Conference on Data Mining'', http://users.csc.calpoly.edu/~fkurfess/Events/DM-KM-01/Volz.pdf {{Webarchive|url=https://web.archive.org/web/20160304125612/http://users.csc.calpoly.edu/~fkurfess/Events/DM-KM-01/Volz.pdf |date=4 березня 2016 }} (retrieved: 18.06.2012).</ref>
-<ref name="McDowell">McDowell, Luke K.; Cafarella, Michael (2006). «Ontology-driven Information Extraction with OntoSyphon», ''Proceedings of the 5th international conference on The Semantic Web'', p. 428—444, http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf (retrieved: 18.06.2012).</ref>
+<ref name="McDowell">McDowell, Luke K.; Cafarella, Michael (2006). «Ontology-driven Information Extraction with OntoSyphon», ''Proceedings of the 5th international conference on The Semantic Web'', p. 428—444, http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf {{Webarchive|url=https://web.archive.org/web/20160310145723/http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf |date=10 березня 2016 }} (retrieved: 18.06.2012).</ref>
 <ref name="Mendes">Mendes, Pablo N.; Jakob, Max; Garcia-Sílva, Andrés; Bizer; Christian (2011). «DBpedia Spotlight: Shedding Light on the Web of Documents», ''Proceedings of the 7th International Conference on Semantic Systems'', p. 1&nbsp;— 8, http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/research/publications/Mendes-Jakob-GarciaSilva-Bizer-DBpediaSpotlight-ISEM2011.pdf {{Webarchive|url=https://web.archive.org/web/20120405211554/http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/research/publications/Mendes-Jakob-GarciaSilva-Bizer-DBpediaSpotlight-ISEM2011.pdf |date=5 квітня 2012 }} (retrieved: 18.06.2012).</ref>
-<ref name="Missikoff">Missikoff, Michele; Navigli, Roberto; Velardi, Paola (2002). «Integrated Approach to Web Ontology Learning and Engineering», ''Computer'', 35(11), p. 60&nbsp;— 63, http://wwwusers.di.uniroma1.it/~velardi/IEEE_C.pdf (retrieved: 18.06.2012).</ref>
+<ref name="Missikoff">Missikoff, Michele; Navigli, Roberto; Velardi, Paola (2002). «Integrated Approach to Web Ontology Learning and Engineering», ''Computer'', 35(11), p. 60&nbsp;— 63, http://wwwusers.di.uniroma1.it/~velardi/IEEE_C.pdf {{Webarchive|url=https://web.archive.org/web/20170519011529/http://wwwusers.di.uniroma1.it/~velardi/IEEE_C.pdf |date=19 травня 2017 }} (retrieved: 18.06.2012).</ref>
-<ref name="Moldovan">2. Moldovan, Dan; Blanco, Eduardo (2012). «Polaris: Lymba's Semantic Parser», Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC), p. 66&nbsp;— 72, http://www.lrec-conf.org/proceedings/lrec2012/pdf/176_Paper.pdf (retrieved: 11.08.2014)</ref>
+<ref name="Moldovan">2. Moldovan, Dan; Blanco, Eduardo (2012). «Polaris: Lymba's Semantic Parser», Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC), p. 66&nbsp;— 72, http://www.lrec-conf.org/proceedings/lrec2012/pdf/176_Paper.pdf {{Webarchive|url=https://web.archive.org/web/20140812203353/http://www.lrec-conf.org/proceedings/lrec2012/pdf/176_Paper.pdf |date=12 серпня 2014 }} (retrieved: 11.08.2014)</ref>
 <ref name="Orchestr8"/>
 <ref name="Presutti">Presutti, Valentina; Draicchio, Francesco; Gangemi, Aldo (2012). «Knowledge Extraction based on Discourse Representation Theory and Linguistic Frames», «Proceedings of the Conference on Knowledge Engineering and Knowledge Management (EKAW2012), LNCS, Springer», http://www.researchgate.net/profile/Aldo_Gangemi/publication/262175193_Knowledge_extraction_based_on_discourse_representation_theory_and_linguistic_frames/links/5488b1bb0cf268d28f08fde6.pdf (retrieved: 18.01.2015).</ref>
@@ Рядок 923: / Рядок 923: @@
 <ref name="Rocket-Software-Inc"/>
 <ref name="semanticweb-org">semanticweb.org (2011). «PoolParty Extractor», http://semanticweb.org/wiki/PoolParty_Extractor {{Webarchive|url=https://web.archive.org/web/20160304185625/http://semanticweb.org/wiki/PoolParty_Extractor |date=4 березня 2016 }} (retrieved: 18.06.2012).</ref>
-<ref name="IMT Holdings">IMT Holdings, Corp (2013). «Rosoka», http://www.rosoka.com/content/capabilities (retrieved: 08.08.2013).</ref>
+<ref name="IMT Holdings">IMT Holdings, Corp (2013). «Rosoka», http://www.rosoka.com/content/capabilities {{Webarchive|url=https://web.archive.org/web/20160510050718/http://www.rosoka.com/content/capabilities |date=10 травня 2016 }} (retrieved: 08.08.2013).</ref>
 <ref name="SRA-International-Inc">SRA International, Inc. (2012). «NetOwl Extractor», http://www.sra.com/netowl/entity-extraction/ {{Webarchive|url=https://web.archive.org/web/20120924081059/http://www.sra.com/netowl/entity-extraction/ |date=24 вересня 2012 }} (retrieved: 18.06.2012).</ref>
-<ref name="The-University-of-Sheffield">The University of Sheffield (2011). «ANNIE: a Nearly-New Information Extraction System», http://gate.ac.uk/sale/tao/splitch6.html#chap:annie (retrieved: 18.06.2012).</ref>
+<ref name="The-University-of-Sheffield">The University of Sheffield (2011). «ANNIE: a Nearly-New Information Extraction System», http://gate.ac.uk/sale/tao/splitch6.html#chap:annie {{Webarchive|url=https://web.archive.org/web/20160315122846/https://gate.ac.uk/sale/tao/splitch6.html#chap:annie |date=15 березня 2016 }} (retrieved: 18.06.2012).</ref>
 <ref name="Uren">Uren, Victoria; Cimiano, Philipp; Iria, José; Handschuh, Siegfried; Vargas-Vera, Maria; Motta, Enrico; Ciravegna, Fabio (2006). «Semantic annotation for knowledge management: Requirements and a survey of the state of the art», ''Web Semantics: Science, Services and Agents on the World Wide Web'', 4(1), p. 14&nbsp;— 28, http://staffwww.dcs.shef.ac.uk/people/J.Iria/iria_jws06.pdf{{Недоступне посилання|date=травень 2019 |bot=InternetArchiveBot }}, (retrieved: 18.06.2012).</ref>
-<ref name="Wimalasuriya">Wimalasuriya, Daya C.; Dou, Dejing (2010). «Ontology-based information extraction: An introduction and a survey of current approaches», ''Journal of Information Science'', 36(3), p. 306—323, http://ix.cs.uoregon.edu/~dou/research/papers/jis09.pdf (retrieved: 18.06.2012).</ref>
+<ref name="Wimalasuriya">Wimalasuriya, Daya C.; Dou, Dejing (2010). «Ontology-based information extraction: An introduction and a survey of current approaches», ''Journal of Information Science'', 36(3), p. 306—323, http://ix.cs.uoregon.edu/~dou/research/papers/jis09.pdf {{Webarchive|url=https://web.archive.org/web/20160411204314/http://ix.cs.uoregon.edu/~dou/research/papers/jis09.pdf |date=11 квітня 2016 }} (retrieved: 18.06.2012).</ref>
 <ref name="Yildiz"/>
 }}

Видобування знань: відмінності між версіями

Версія за 10:34, 4 червня 2022

Огляд

Приклади

Зв'язування об'єктів

Реляційні бази даних в RDF

Витяг з структурованих джерел в RDF

1: 1 Відображення з таблиць БД / Види на RDF Entities / Властивості / Значення

Складні відображення реляційних баз даних в RDF

XML

Огляд методів / Інструменти

Витяг з природних джерел мови

Традиційне вилучення інформації (IE)

Онтологія на основі вилучення інформації (OBIE)

Онтологія навчання (ОН)

Семантична анотація (SA)

інструменти

Виявлення знань

Вхідні дані

вихідні формати

Див. також

Примітки

Навігаційне меню

Пошук