Пошуковий запит

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Пошуковий запит — запит, який користувач вводить в пошукову систему, щоб задовольнити свої потреби в інформації. Особливість пошукових запитів полягає в тому, що вони являють собою простий текст або гіпертекст з додатковими пошуковими директивами (наприклад, «і» чи «або»). Пошукові запити суттєво відрізняються від стандартних мов запитів, які регулюються строгими правилами синтаксису як в командних мовах[en] з ключовими словами або позиційними параметрами.

Типи пошукових запитів[ред. | ред. код]

Є три основні категорії, які охоплюють більшість пошукових запитів: інформаційні, навігаційні та транзакційні.[1] Хоча ця модель пошуку не була отримана теоретично, класифікація емпірично підтверджується фактичними запитами в пошукових системах.[2]

  • Інформаційні запити — запити, які охоплюють широку тему, для яких може бути тисячі подібних результатів.
  • Навігаційні запити — запити, які шукають певний вебсайт або його окремі сторінки.
  • Транзакційні запити — запити, що відображають намір користувача виконати певну дію, як придбання автомобіля або завантаження певної програми.

Характеристики[ред. | ред. код]

Більшість комерційних пошукових систем не розкривають історію пошукових запитів, тому інформацію про те, що шукають користувачі в Інтернеті, важко знайти.[3] Проте в 1998 році явилися перші дослідження на цю тему.[4][5] Пізніше, в 2001 році[6], було проведене та опубліковане дослідження запитів пошукової системи Excite, яке виявило деякі цікаві характеристики вебпошуку:

  • Середня довжина пошукового запиту — 2,4 слова.
  • Близько половини користувачів зробили лише один запит, тоді як трохи менше, ніж третина користувачів зробили три або більше унікальних запитів.
  • Близько половини користувачів розглянули лише одну або дві сторінки результатів (на кожній сторінці усього 10 результатів).
  • Менше 5 % користувачів використовували розширені функції пошуку (наприклад, логічні оператори AND, OR та NOT).
  • Три найбільш часто використовувані слова були (порожній пошук), «і» та «секс».

Аналіз пошукових запитів Excite показав, що 19 % запитів містили географічний термін (наприклад, географічні назви, поштові індекси і т. д.).[7] Дослідження також показують, що є передбачувані патерни до того, як користувачі змінюють свої запити.[8]

Вивчення журналів пошукових запитів Yahoo у 2005 році показав, що 33 % запитів від одного користувача були повторні запити і що 87 % часу, користувач натискав на один і той самий результат.[9] Це говорить про те, що багато користувачів використовують повторні запити аби знову знайти одну і ту саму інформацію. Цей висновок підтверджує пост у блозі пошукової системи Bing, де говориться, що 30 % запитів є навігаційними запити.[10]

Крім того, багато досліджень показали, що частотний розподіл слів у пошукових запитах відповідає степеневому закону. Тобто найчастіше використовується невелика група слів, які спостерігаються у великій кількості запитів, в той час як інші слова використовуються рідше й окремо.[11] Цей приклад принципу Парето (або 80-20) дозволяє пошуковим системам використовувати методи оптимізації, такі як індексація або поділ бази даних, кешування і випереджаюча вибірка. Також були проведені дослідження з виявлення лінгвістично-орієнтованих атрибутів, які могли б вказувати на тип пошукового запиту.[12]

В недавньому дослідженні 2011 року було встановлено, що середня довжина запитів з плином часу зростає, й для неанглійських мов цей процес протікає швидше.[13]

Структуровані запити[ред. | ред. код]

З пошуковими системами, які підтримують логічні оператори і круглі дужки, є можливим застосування метода, що традиційно використовувався бібліотекарями. Користувач, який шукає документи, які охоплюють кілька тем або аспектів, може використовувати диз'юнкції характерних слів, наприклад, автомобілі OR машини. Кон'юнкції (за допомогою логічного оператора AND) таких запитів можуть зробити пошук навіть більш потужним й багатогранним.[14]

Посилання[ред. | ред. код]

  1. Broder, A. (2002). A taxonomy of Web search. SIGIR Forum, 36(2), 3–10.
  2. Jansen, B. J., Booth, D., and Spink, A. (2008) Determining the informational, navigational, and transactional intent of Web queries, Information Processing & Management. 44(3), 1251—1266.
  3. Dawn Kawamoto and Elinor Mills (2006), AOL apologizes for release of user search data
  4. Jansen, B. J., Spink, A., Bateman, J., and Saracevic, T. 1998. Real life information retrieval: A study of user queries on the web. SIGIR Forum, 32(1), 5 -17.
  5. Silverstein, C., Henzinger, M., Marais, H., & Moricz, M. (1999). Analysis of a very large Web search engine query log. SIGIR Forum, 33(1), 6–12.
  6. Amanda Spink; Dietmar Wolfram; Major B. J. Jansen; Tefko Saracevic (2001). Searching the web: The public and their queries (PDF). Journal of the American Society for Information Science and Technology. 52 (3): 226—234. doi:10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.3.CO;2-I.
  7. Mark Sanderson & Janet Kohler (2004). Analyzing geographic queries. Proceedings of the Workshop on Geographic Information (SIGIR '04).
  8. Jansen, B. J., Booth, D. L., & Spink, A. (2009). Patterns of query modification during Web searchin. Journal of the American Society for Information Science and Technology. 60(3), 557—570. 60(7), 1358—1371.
  9. Jaime Teevan; Eytan Adar; Rosie Jones; Michael Potts (2005). History repeats itself: Repeat Queries in Yahoo's query logs (PDF). Proceedings of the 29th Annual ACM Conference on Research and Development in Information Retrieval (SIGIR '06). с. 703—704. doi:10.1145/1148170.1148326.[недоступне посилання з квітня 2019]
  10. http://www.bing.com/community/site_blogs/b/search/archive/2011/02/10/making-search-yours.aspx
  11. Ricardo Baeza-Yates (2005). Applications of Web Query Mining. 3408. Springer Berlin / Heidelberg: 7—22. ISBN 978-3-540-25295-5.
  12. Alejandro Figueroa (2015). Exploring effective features for recognizing the user intent behind web queries. 68. Elsevier: 162—169.
  13. Mona Taghavi; Ahmed Patel; Nikita Schmidt; Christopher Wills; Yiqi Tew (2011). An analysis of web proxy logs with query distribution pattern approach for search engines. 34 (1). Elsevier: 162—170. doi:10.1016/j.csi.2011.07.001.
  14. Vojkan Mihajlović; Djoerd Hiemstra; Henk Ernst Blok; Peter M.G. Apers. Exploiting Query Structure and Document Structure to Improve Document Retrieval Effectiveness (PDF).