Sitemap
Sitemap — это XML файл, с помощью которого вебмастер может сообщать поисковым системам о страницах сайта, которые роботу можно просканировать.
Файл выглядит как XML документ, в котором перечислены URL‘ы страниц сайта с метаданными, связанными с каждой ссылкой, например:
- Дата последнего изменения (lastmod, как правило берется с сервера)
- Частота изменений (changefreq, ниже приведен полный список вариантов значений)
- Приоритет страницы (priority, значение указывается в виде числа от 0.1 до 1)
По карте сайта поисковым системам удобнее и проще индексировать ваш сайт (не говоря уж о том, что это происходит гораздо быстрее).
Частота обновления страниц, указанная в sitemap бывает следующая:
- Always — поисковой робот будет проверять страницу на предмет изменений при каждом визите
- Hourly — поисковой робот будет проверять страницу на предмет изменений каждый час (точнее, при каждом визите, если между визитами прошел час или более)
- Daily — ежедневно (естественно, если поисковой робот приходит раз в неделю то и проверять будет страницу раз в неделю)
- Weekly — еженедельно, условия аналогичны остальным пунктам.
- Monthly — ежемесячно
- Yearly — ежегодно
- Never — никогда. Поисковой робот, просканировав страницу однажды, вряд ли снова придет туда снова.
Стоит напомнить, что sitemap — это не гарантия индексации, и если Вы прописали страницу в sitemap’e — это не значит, что сейчас набегут боты и выкинут страницу в топ выдачи) Точно так же и с частотой обновления — во-первых, если на необновляемую страницу поставить обновление Always — поисковик может решить что над ним издеваются и обидеться, а во-вторых, если поисковик считает, что «таки ви не пгавы,эту стганичку надо обновлять в 10 газ чаще» — он будет делать по-своему)
Нужно ли указывать в Sitemap все возможные параметры страницы?
Небольшой комментарий касательно правильности генерации карты сайта. Практическим путем было выяснено, что если в sitemap содержатся только ссылки на страницы, без информации о дате последнего изменения страницы, частоте сканирования и приоритета — он воспринимается поисковиком гораздо хуже, чем если все параметры указаны.
В моем случае было 2 файла sitemap, каждый примерно на 250 ссылок (ссылки были одни и те же, карты сайта загружались не одновременно). Один был оформлен полностью, а второй содержал только ссылки (изначально на сайт был загружен именно он). Из первого поисковик проиндексировал примерно 95% ссылок, а из второго — около 10%, что позволяет делать определенные выводы о необходимости указания всех возможных параметров в sitemap.
Так что лично я рекомендую оформлять информацию о страницах в sitemap примерно так:
<url> <loc>http://reblaog.ru/servisyi-i-programmyi/html-podpisi-v-outlook-2010-windows-7/</loc> <lastmod>2012-06-08T15:02:59+00:00</lastmod> <changefreq>always</changefreq> <priority>0.2</priority> </url>
comments powered by HyperComments