Sitemap

Sitemap — это XML файл, с помощью которого вебмастер может сообщать поисковым системам о страницах сайта, которые роботу можно просканировать.
Файл выглядит как XML документ, в котором перечислены URL‘ы страниц сайта с метаданными, связанными с каждой ссылкой, например:

  • Дата последнего изменения (lastmod, как правило берется с сервера)
  • Частота изменений (changefreq, ниже приведен полный список вариантов значений)
  • Приоритет страницы (priority, значение указывается в виде числа от 0.1 до 1)

По карте сайта поисковым системам удобнее и проще индексировать ваш сайт (не говоря уж о том, что это происходит гораздо быстрее).
Частота обновления страниц, указанная в sitemap бывает следующая:

  • Always — поисковой робот будет проверять страницу на предмет изменений при каждом визите
  • Hourly — поисковой робот будет проверять страницу на предмет изменений каждый час (точнее, при каждом визите, если между визитами прошел час или более)
  • Daily — ежедневно (естественно, если поисковой робот приходит раз в неделю то и проверять будет страницу раз в неделю)
  • Weekly — еженедельно, условия аналогичны остальным пунктам.
  • Monthly — ежемесячно
  • Yearly — ежегодно
  • Never — никогда. Поисковой робот, просканировав страницу однажды, вряд ли снова придет туда снова.

Стоит напомнить, что sitemap — это не гарантия индексации, и если Вы прописали страницу в sitemap’e — это не значит, что сейчас набегут боты и выкинут страницу в топ выдачи) Точно так же и с частотой обновления — во-первых, если на необновляемую страницу поставить обновление Always — поисковик может решить что над ним издеваются и обидеться, а во-вторых, если поисковик считает, что «таки ви не пгавы,эту стганичку надо обновлять в 10 газ чаще» — он будет делать по-своему)

 

Нужно ли указывать в Sitemap все возможные параметры страницы?

Небольшой комментарий касательно правильности генерации карты сайта. Практическим путем было выяснено, что если в sitemap содержатся только ссылки на страницы, без информации о дате последнего изменения страницы, частоте сканирования и приоритета — он воспринимается поисковиком гораздо хуже, чем если все параметры указаны.

В моем случае было 2 файла sitemap, каждый примерно на 250 ссылок (ссылки были одни и те же, карты сайта загружались не одновременно). Один был оформлен полностью, а второй содержал только ссылки (изначально на сайт был загружен именно он). Из первого поисковик проиндексировал примерно 95% ссылок, а из второго — около 10%, что позволяет делать определенные выводы о необходимости указания всех возможных параметров в sitemap.

Так что лично я рекомендую оформлять информацию о страницах в  sitemap примерно так:

	<url>
		<loc>http://reblaog.ru/servisyi-i-programmyi/html-podpisi-v-outlook-2010-windows-7/</loc>
		<lastmod>2012-06-08T15:02:59+00:00</lastmod>
		<changefreq>always</changefreq>
		<priority>0.2</priority>
	</url>

 

comments powered by HyperComments