Apache Solr

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Apache Solr
Surface1.png
Тип пошукова система
Розробник Apache Software Foundation
Стабільний випуск 7.4.0 (червня 27, 2018; 3 місяці тому (2018-06-27)[1])
Версії 7.5.0 (24 вересня 2018)
Репозиторій git.apache.org/lucene-solr.git
Платформа Віртуальна машина Java
Написано на Java[2]
Ліцензія Apache-2.0[d]
lucene.apache.org/solr/

Solr (вимовляється як «солар») вільне та відкрите програмне забезпечення, пошукова платформа реалізована на Java, базується на Apache Lucene. Основні можливості включають повнотекстовий пошук, підсвічування результатів, фасетний пошук[en], індексування в реальному часі, динамічну кластеризацію, інтеграцію з базами даних, NoSQL можливості, обробку складних форматів (наприклад, Word, PDF). Solr має можливості розподіленого пошуку та реплікації індексу, має дуже добру масштабованість і стійкість до відмов.[3] Solr — один з найпопулярніших пошукових рушіїв (другий за популярністю після Elasticsearch).[4]

Solr запускається як окремий сервер.  Використовує бібліотеку Lucene як ядро для впровадження повнотекстового пошуку та індексації, має REST-подібний HTTP/XML і JSON API що дозволяє використовувати Solr програмами написаними на інших мовах програмування. Solr має гнучку систему налаштувань та дозволяє підключення зовнішніх модулів (плагінів).

Apache Lucene та Apache Solr розроблюються однією командою Apache Software Foundation після їх злиття в 2010 році. Дуже часто на ці продукти посилаються як на Lucene/Solr або Solr/Lucene.

Властивості[ред. | ред. код]

  • Використовує бібліотеку Lucene для повнотекстового пошуку
  • Фасетний пошук[en]
  • Підсвічування результатів
  • Мова запитів підтримує структурування, як і текстовий пошук
  • Безсхемний режим і режим зі схемами через REST API
  • JSON, XML, PHP, Ruby, Python, XSLT, Velocity[en] та отримання результатів у користувацьких Java бінарних форматах через HTTP
  • HTML інтерфейс адміністратора
  • Вбудовані засоби безпеки: автентифікація, авторизація, SSL
  • Реплікація на інші Solr сервери - дозволяє масштабувати кількість запитів на секунду та надає високу доступність[en]
  • Розподілений пошук за допомогою шардінгу[en] - дозволяє масштабувати за об'ємом контенту
  • Кластеризація при пошуку використовує Carrot2[en]
  • Розширюваність за допомогою плагінів
  • Гнучка релевантність - прискорення за допомогою функціональних запитів
  • Кешування - для запитів, фільтрів та документів
  • Інтеграція у Java-застосунки
  • Гео-розподілений пошук
  • Автоматичне керування великими кластерами за допомогою ZooKeeper[en]
  • Функціональні запити
  • Групування полів[5]
  • Автозаповнення
  • Стрімінг

Застосування[ред. | ред. код]

Apache Solr був використаний, зокрема, Міжнародним консорціумом журналістів-розслідувачів для дослідження інформації у так званих «панамських документах»[6].

Примітки[ред. | ред. код]

  1. News. Apache Foundation. Процитовано 27 Jun 2018. 
  2. The solr Open Source Project on Open Hub: Languages Page
  3. Apache Solr -. lucene.apache.org. Процитовано 2016-02-10. 
  4. DB-Engines Ranking - popularity ranking of search engines. db-engines.com. Процитовано 2016-02-10. 
  5. Solr Result Grouping
  6. Mar Cabra, Erin Kissane (11 квітня 2016). The People and Tech Behind the Panama Papers. opennews.org. An OpenNews project. Процитовано 18 квітня 2016. 

Див. також[ред. | ред. код]