Sitemap
Sitemaps — це XML-файл з інформацією для пошукових систем (таких як Google, Yahoo, Ask.com, Bing, Яндекс) про сторінки веб-сайт а, які підлягають індексації. Sitemaps може допомогти пошуковикам визначити місцезнаходження сторінок сайту, час їхнього останнього поновлення, частоту оновлення та важливість щодо інших сторінок сайту для того, щоб пошукова машина змогла більш розумно індексувати сайт.
Використання протоколу Sitemaps не є гарантією того, що веб-сторінки будуть проіндексовані пошуковими системами, це всього лише додаткова підказка для сканерів, які зможуть виконати ретельніше сканування Вашого сайту.[1]
Зміст |
Формат протоколу Sitemap [ред.]
Формат протоколу Sitemap складається з XML-тегів. У файлі необхідно використовувати кодування UTF-8.
Приклад XML-файлу Sitemap [ред.]
Нижче наведено приклад файлу Sitemap, в якому міститься тільки один URL-адресу та використані всі необов'язкові теги.
<?xml version = "1.0" encoding = "UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc> http://example.com/</loc> <lastmod> 2005-01-01 </lastmod> <changefreq> monthly </changefreq> <priority> 0.8 </priority> </Url> </Urlset>
Використання файлів індексу Sitemap [ред.]
Можна надати декілька файлів Sitemap, однак у кожному з цих файлів має бути не більше 50000 URL, а розмір кожного з цих файлів не повинен перевищувати 10 МБ. При необхідності файл Sitemap можна стиснути за допомогою архіватора gzip, щоб його розмір не перевищував 10 МБ, і тим самим зменшити вимоги до пропускної здатності каналу.
Якщо необхідно перерахувати більше 50000 URL, слід створити декілька файлів Sitemap, при цьому необхідно перерахувати кожний з цих файлів у файлі індексу Sitemap (Sitemap index). Формат файлу індексу Sitemap схожий на формат файлу Sitemap.
Детальна інформація про використання файлів індексу Sitemap на офіційному сайті: sitemaps.org.
Інші формати файлу Sitemap [ред.]
- Канал синдикації (RSS 2.0, а також Atom 0.3 або 1.0)
- Текстовий файл (у текстовому файлі в кожному рядку повинен бути тільки один URL)
Розташування файлу Sitemap [ред.]
Рекомендується розташовувати файл Sitemap в кореневій директорії сервера, щоб посилання виглядала приблизно так: http://example.com/sitemap.xml.
- Всі посилання, перераховані у файлі Sitemap, повинні знаходитися в тому ж домені, що і сам Sitemap.
- Наприклад, якщо файл Sitemap знаходиться за адресою http://www.example.com/sitemap.xml, то він не може включати в себе посилання сторінок з доменів http://subdomain.example.com або http://example.com.
- Посилання у файлі Sitemap повинні вказувати на сторінки, що знаходяться в тому ж каталозі (або його підкаталогах), що і сам файл Sitemap.
- Наприклад, якщо файл Sitemap знаходиться на http://www.example.com/catalog/sitemap.xml то він не може включати в себе посилання на сторінки http://www.example.com/page.html або http://www.example.com/dir/page.html.
- Посилання, зазначені у файлі Sitemap повинні використовувати той же протокол (наприклад, HTTP), за яким доступний файл Sitemap.
- Це означає, що якщо файл Sitemap знаходиться на http://www.example.com/sitemap.xml, то він не може містити посилання типу https://www.example.com/page.html і ftp://www.example.com/file.doc.
Перевірка файлу Sitemap [ред.]
Для визначення елементів і атрибутів, які можуть з'являтися у файлах Sitemap, використовуються наступні XML-схеми:
- Для файлів Sitemap: http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd
- Для файлів індексу Sitemap: http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd
Повідомлення для сканерів пошукових систем [ред.]
Після того, як файл Sitemap створений та розміщений на веб-сервері, необхідно повідомити про місцезнаходження цього файлу пошуковим системам, що підтримують цей протокол. Це можна зробити наступним чином:
- за допомогою інтерфейсу пошукової системи
- вказавши місце розташування файлу Sitemap у файлі robots.txt
- виславши HTTP-запит
Потім пошукові системи зможуть отримати файл Sitemap і дозволити своїм сканерам доступ до URL-адресами.
Використання файлу robots.txt [ред.]
Щоб повідомити пошуковим системам місце розташування файлу Sitemap, можна в robots.txt додати рядок виду:
Sitemap:
Де <sitemap_location> — повний URL файлу Sitemap, наприклад: http://www.example.com/sitemap.xml.
Використання HTTP-запиту [ред.]
Можна вказати пошуковим системам місцезнаходження файлу Sitemap за допомогою HTTP-запиту, використовуючи таблицю:
| Пошукова система | Адреса | Опис |
|---|---|---|
| http://google.com/webmasters/sitemaps/ping?sitemap= | Оновлення файлу Sitemap | |
| Яндекс | http://webmaster.yandex.ru/wmconsole/sitemap_list.xml?host= | Файли Sitemap |
| Yahoo! | http://search.yahooapis.com/SiteExplorerService/V1/updateNotification?appid=SitemapWriter&url= http://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap= |
Does Yahoo! support Sitemaps? |
| Ask.com | http://submissions.ask.com/ping?sitemap= | Q: Does Ask.com support sitemaps? |
| Bing | http://www.bing.com/webmaster/ping.aspx?siteMap= | Bing Webmaster Center |
Де <sitemap_location> необхідно замінити на повний URL файлу Sitemap.
Наприклад, щоб додати файл http://www.example.com/sitemap.xml у пошуковик Google, потрібно відправити HTTP-запит http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.example.com/sitemap.xml.
Примітки [ред.]
Посилання [ред.]
- Офіційний сайт (рос.) (створений за підтримки Google, Yahoo, Microsoft)
- Управління файлами Google Sitemaps
- Sitemap в Google Code (англ.)
