Разработка сайтов, создание сайтов
главная / Web-дизайн / Формат карты сайта

Формат карты сайта

Формат карты сайта

Карта сайта (sitemap) это файл, написанный на языке xml и созданный специально для поисковых систем. Карта сайта помогает поисковым роботам проиндексировать страницы сайта, ускоряя процесс индексации.

Вот так будет выглядеть карта сайта для одной страницы:


1. <?xml version="1.0" encoding="UTF-8"?>
2. <urlset xmlns="http://www.sitemaps.org/schemas/
sitemap/0.9">
3. <url>
4. <loc>http://seopos.ru/vnytrennyaya-optimizaciya/
format-karti-sajta.html</loc>
5. <lastmod>2009-06-21</lastmod>
6. <changefreq>monthly</changefreq>
7. <priority>0.5</priority>
8. <url>
9. </urlset>

Первые две строчки в файле, как и последняя обязательны. Первая строка указывает поисковикам, какая у нас версия xml файла и кодировку файла.

Вторая строка указывает на стандарт, которого мы будем придерживаться при создании карты сайта, последняя является закрывающим тегом для нее.

Основные теги xml карты сайта

Основной тег в карте сайта это url, этот тег используется для перечисления каждой страницы вашего сайта, каждая страница, включенная в карту сайта в файле xml должна начинаться и заканчиваться тегом url.

loc (обязательное) - полный путь или ссылка на страницу

lastmod (опциональное) - дата и время последней модификации страницы в формате YYYY-MM-DDThh:mm:ss+00:00. При чем время можно опустить и оставить только дату <lastmod>2004-11-14</lastmod>

changefreq (опциональное) - частота, с которой вероятнее всего будет изменяться страница (частота проверки этой страницы поисковиком). Воспринимается поисковиком как подсказка, а не команда. Возможные значения:

  • "always" - всегда
  • "hourly" - каждый час
  • "daily" - каждый день
  • "weekly" - каждую неделю
  • "monthly" - каждый месяц
  • "yearly" - раз в год
  • "never - никогда

priority (опциональное) - дополнительный приоритет этой страницы, относительно других страниц на том же сайте. возможное значение число от 0.0 до 1.0, где 0.0 - соответствует самому низкому приоритету, а 1.0 самый высокий приоритет.

Маскирование символов

Некоторые спецсимволы в карте сайта необходимо маскировать, список символов представлен ниже:

Символ Маскирование
Амперсанд & &amp;
Одинарные кавычки ' &apos;
Двойные кавычки " &quot;
Больше > &gt;
Меньше < &lt;

Для примера строка с динамическим url'ом, записанная так
<loc>http://www.your_site.ru/test.php?task=view&name=vasia</loc> будет являться не правильной записью,
а правильным будет замена знака амперсанда на символы маскирования из таблицы, вот так:
<loc>http://www.your_site.ru/test.php?task=view&amp;name=vasia</loc>

Индексный файл для карты сайта

XML файл карты сайта должен состоять не более чем из 50 000 адресов и его объем не должен быть больше 10 мегабайт. Если же на сайте больше 50 000 страниц, либо объем самого файла превышает 10 мегабайт, можно воспользоваться возможностью подключения нескольких файлов sitemap.xml.

Для создания нескольких файлов карты сайта, необходимо создать индексный файл, в котором будут перечислены все файлы sitemap. Индексный файл содержит адреса к остальным картам сайта.

Если требуется передать несколько файлов Sitemap, необходимо перечислить каждый из этих файлов в файле индекса Sitemap. В индексном файле карты сайта может быть перечислено не более 1000 файлов с картами сайта. Размер этого файла не должен превышать 10 МБ. Формат индексного XML файла карты сайта очень похож на формат обычного XML файла карты сайта:

1. <?xml version="1.0" encoding="UTF-8"?>
2. <sitemapindex xmlns="http://www.sitemaps.org/schemas/
sitemap/0.9">
3. <sitemap>
4. <loc>http://www.your_site.ru/sitemap1.xml</loc>
5. <lastmod>2004-10-01T18:23:17+00:00</lastmod>
6. </sitemap>
7. <sitemap>
8. <loc>http://www.your_site.ru/sitemap2.xml</loc>
9. <lastmod>2005-01-01</lastmod>
10. </sitemap>
11. </sitemapindex>

Первая строка, такая же, как и в обычном файле карты сайта, указывает на то какая версия xml файла и кодировку файла.

Вторая строка начинается тегом sitemapindex (вместо urlset в обычной карте сайта) указывает на стандарт, которого мы будем придерживаться при создании карты сайта, последняя является закрывающим тегом для нее.

Для каждой карты сайта в индексном файле создается как родительский XML тег.

- содержит url к карте сайта.

Необязательный тег также доступен для индексного файла.

Примечание. Индексный файл карты сайта может указывать только на файлы карты сайта, которые находятся на том же сайте, что и индексный файл. Например, индексный файл http://www.your_site.ru/sitemap_index.xml может включать файлы карты сайта, размещенные на сайте http://www.your_site.ru, но не на сайте http://www.not_your_site.ru или http://poddomen.your_site.ru. Для индексного файла, как и для файлов карт сайта, необходимо использовать кодировку UTF-8.

В индексном файле к спецсимволам также должно применяться маскирование.

Особенности карты сайта

  • xml файл карты сайта должен иметь кодировку UTF-8.
  • для всех спецсимволов в файле должно быть выполнено маскирование. К ним относятся амперсанд (&), одинарная кавычка ('), двойная кавычка ("), знак "меньше" (<) и знак "больше" (>).
  • один xml файл должен состоять не более чем из 50 000 адресов и его объём не должен превышать 10 мегабайт; Если же одно из этих условий не выполняется, то необходимо создать несколько файлов карты сайта и прописать информацию о них в индексном файле.
  • Стандартом предусмотрена вложенность: в каждой директории может быть свой sitemap.xml, описывающий файлы в директории и в поддиректориях. Ссылок на директории, выше существующей, а также на посторонние домены (в этом списке и поддомены основного домена) быть не должно.
  • адреса и пути должны начинаться с http://

После того как карта сайта будет создана, разместите ее в корневом каталоге сайта и пропишите такую строчку в файле robots.txt (который также должен находиться в корне):
Sitemap: http://your_site.ru/sitemap.xml



Источник: seopos.ru
текущее:

НОВОСТИ

2011 г., «VisMech.ru»