Natural Language Toolkit: відмінності між версіями
[перевірена версія] | [перевірена версія] |
Bluelink 1 book for Перевірність (20240101)) #IABot (v2.0.9.5) (GreenC bot |
Yohuuu (обговорення | внесок) Функція пропозицій посилань: додано 1 посилання. |
||
Рядок 24: | Рядок 24: | ||
Набір '''інструментів природної мови''', або частіше '''NLTK''', — це набір [[Бібліотека підпрограм|бібліотек]] і програм для символьної та статистичної [[Обробка природної мови|обробки природної мови]] (NLP) для англійської мови, написаних [[Python|мовою програмування Python]]. Його розробили Стівен Берд і Едвард Лопер з кафедри комп'ютерних та інформаційних наук [[Пенсільванський університет|університету Пенсільванії]]<ref>{{Cite web|url=http://www.nltk.org/book/ch00.html|title=Preface|website=www.nltk.org|accessdate=2016-06-15|archive-date=26 січня 2022|archive-url=https://web.archive.org/web/20220126054229/https://www.nltk.org/book/ch00.html}}</ref>. NLTK містить як набори даних, так і графічні матеріали. До пакету входить книга, яка пояснює основні концепції завдань обробки мови, що підтримуються набором інструментів<ref name=Bird-Klein-Loper/>, а також прикладами застосування пакету<ref name=Perkins/>. |
Набір '''інструментів природної мови''', або частіше '''NLTK''', — це набір [[Бібліотека підпрограм|бібліотек]] і програм для символьної та статистичної [[Обробка природної мови|обробки природної мови]] (NLP) для англійської мови, написаних [[Python|мовою програмування Python]]. Його розробили Стівен Берд і Едвард Лопер з кафедри комп'ютерних та інформаційних наук [[Пенсільванський університет|університету Пенсільванії]]<ref>{{Cite web|url=http://www.nltk.org/book/ch00.html|title=Preface|website=www.nltk.org|accessdate=2016-06-15|archive-date=26 січня 2022|archive-url=https://web.archive.org/web/20220126054229/https://www.nltk.org/book/ch00.html}}</ref>. NLTK містить як набори даних, так і графічні матеріали. До пакету входить книга, яка пояснює основні концепції завдань обробки мови, що підтримуються набором інструментів<ref name=Bird-Klein-Loper/>, а також прикладами застосування пакету<ref name=Perkins/>. |
||
NLTK призначений для підтримки досліджень і викладання навчальних курсів пов'язаних з [[Обробка природної мови|НЛП]] та близькоспорідненими областями, включаючи емпіричну [[Мовознавство|лінгвістику]], [[Когнітивна наука|когнітивну науку]], [[штучний інтелект]], [[Інформаційний пошук|пошук інформації]] та [[машинне навчання]]<ref name=Bird-Klein-Loper-Baldridge/>. NLTK успішно використовується як навчальний інструмент, а також як платформа для створення прототипів і побудови дослідницьких систем. У США та ще у 25 країнах 32 університети використовують NLTK у своїх курсах. NLTK підтримує функціональні можливості класифікації, токенізації, [[стемінг]]у, тегів, аналізу та семантичного міркування.<ref>{{Cite web|url=https://docs.google.com/document/d/1eYubSwLkpB7ZgfQVxxAwgsmAqS__BRfbMyP9qV6ngD8/edit|title=NLTK Courses|website=Google Docs|accessdate=2016-06-15|archive-date=29 січня 2022|archive-url=https://web.archive.org/web/20220129092053/https://docs.google.com/document/d/1eYubSwLkpB7ZgfQVxxAwgsmAqS__BRfbMyP9qV6ngD8/edit}}</ref> |
NLTK призначений для підтримки досліджень і викладання навчальних курсів пов'язаних з [[Обробка природної мови|НЛП]] та близькоспорідненими областями, включаючи емпіричну [[Мовознавство|лінгвістику]], [[Когнітивна наука|когнітивну науку]], [[штучний інтелект]], [[Інформаційний пошук|пошук інформації]] та [[машинне навчання]]<ref name=Bird-Klein-Loper-Baldridge/>. NLTK успішно використовується як навчальний інструмент, а також як платформа для створення прототипів і побудови дослідницьких систем. У [[Сполучені Штати Америки|США]] та ще у 25 країнах 32 університети використовують NLTK у своїх курсах. NLTK підтримує функціональні можливості класифікації, токенізації, [[стемінг]]у, тегів, аналізу та семантичного міркування.<ref>{{Cite web|url=https://docs.google.com/document/d/1eYubSwLkpB7ZgfQVxxAwgsmAqS__BRfbMyP9qV6ngD8/edit|title=NLTK Courses|website=Google Docs|accessdate=2016-06-15|archive-date=29 січня 2022|archive-url=https://web.archive.org/web/20220129092053/https://docs.google.com/document/d/1eYubSwLkpB7ZgfQVxxAwgsmAqS__BRfbMyP9qV6ngD8/edit}}</ref> |
||
== Основні компоненти бібліотеки == |
== Основні компоненти бібліотеки == |
Версія за 09:28, 14 травня 2024
Тип | Обробка природної мови |
---|---|
Автор | Стівен Берд, Едвард Лопер, Еван Клейн |
Розробники | Team NLTK |
Перший випуск | 2001[1] |
Стабільний випуск | 3.6.1 (7 квітня, 2021[2]) |
Версії | 3.8.1 (2 січня 2023)[3] |
Мова програмування | Python |
Ліцензія | Apache 2.0[4] |
Онлайн-документація | nltk.org/api/nltk.html |
Репозиторій | github.com/nltk/nltk |
Вебсайт | www.nltk.org |
Набір інструментів природної мови, або частіше NLTK, — це набір бібліотек і програм для символьної та статистичної обробки природної мови (NLP) для англійської мови, написаних мовою програмування Python. Його розробили Стівен Берд і Едвард Лопер з кафедри комп'ютерних та інформаційних наук університету Пенсільванії[5]. NLTK містить як набори даних, так і графічні матеріали. До пакету входить книга, яка пояснює основні концепції завдань обробки мови, що підтримуються набором інструментів[6], а також прикладами застосування пакету[7].
NLTK призначений для підтримки досліджень і викладання навчальних курсів пов'язаних з НЛП та близькоспорідненими областями, включаючи емпіричну лінгвістику, когнітивну науку, штучний інтелект, пошук інформації та машинне навчання[8]. NLTK успішно використовується як навчальний інструмент, а також як платформа для створення прототипів і побудови дослідницьких систем. У США та ще у 25 країнах 32 університети використовують NLTK у своїх курсах. NLTK підтримує функціональні можливості класифікації, токенізації, стемінгу, тегів, аналізу та семантичного міркування.[9]
Основні компоненти бібліотеки
- Лексичний аналіз: Токенізатор слів і тексту
- n-грам і колокації
- Теггер частини мови
- Модель дерева та фрагмент тексту для запису
- Розпізнавання іменованих об'єктів
Див. також
Примітки
- ↑ Project site on SourceForge. 9 липня 2001. Архів оригіналу за 29 січня 2022. Процитовано 29 січня 2022.
- ↑ NLTK ChangeLog. nltk.org. Архів оригіналу за 29 січня 2022. Процитовано 13 квітня 2021.
- ↑ Release 3.8.1 — 2023.
- ↑ NLTK License. NLTK Project. Архів оригіналу за 29 січня 2022. Процитовано 14 лютого 2015.
- ↑ Preface. www.nltk.org. Архів оригіналу за 26 січня 2022. Процитовано 15 червня 2016.
- ↑ Bird, Steven; Klein, Ewan; Loper, Edward (2009). Natural Language Processing with Python. O'Reilly Media Inc. ISBN 978-0-596-51649-9.
- ↑ Perkins, Jacob (2010). Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing. ISBN 978-1849513609.
- ↑ Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). Multidisciplinary instruction with the Natural Language Toolkit (PDF). Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL. Архів оригіналу (PDF) за 2 September 2011.
- ↑ NLTK Courses. Google Docs. Архів оригіналу за 29 січня 2022. Процитовано 15 червня 2016.