Основы индексации сайтов на MODx: понимание принципов работы поисковых роботов

MODx — это CMS с открытым исходным кодом. Только по сравнению с WordPress плагинов значительно меньше, а готовых решений по ускорению индексации недостаточно. Для полноценной оптимизации сайта на MODx Revolution потребуются навыки программирования и понимание принципов SEO.

Работа с метатегами

Метатеги помогают поисковым роботам сканировать содержимое страницы и ранжировать её в результатах поиска:

  • Title: отображается в заголовке браузера и в результатах поиска. Он должен быть кратким, информативным и содержать ключевые слова. Рекомендуемая длина: 50–70 символов.
  • Description: отображается в результатах поиска под title. Должен быть кратким и интересным, чтобы побудить пользователей перейти на сайт. Рекомендуемая длина: 150–160 символов.
  • Keywords: используются поисковыми роботами для определения тематики страницы. В MODx можно добавить несколько keywords через запятую. Не стоит злоупотреблять ключевыми словами.
  • H1: главный заголовок, который виден пользователям. Должен быть уникальным и содержать ключевые слова. Не рекомендуется использовать более одного h1 на странице.

Есть десятки дополнительных метатегов, но большинство из них не имеют отношения к SEO-оптимизации и считаются устаревшими.

Для head также рекомендуется прописывать:

  • link rel=«canonical» — избавляет от дублей страниц, можно выводить при помощи сниппета. Пользователям PdoPage нужно добавить в его вызов параметр «‘setMeta’ => 0;».
  • meta name=«robots» — управляется чекбоксом «Доступен для поиска». Диактивация устанавливает для страницы запрет на индексацию с помощью noindex, nofollow.
  • meta name=«author» — автор контента. Тег прописывается вручную или переносится из профиля.
  • meta name=«language» — язык контента. Сайт чаще отображается в результатах поиска для пользователей, ищущих информацию на данном языке в вашем регионе.

На индексацию влияет и качество вёрстки. Например: не рекомендуется обозначать элементы навигации через теги заголовков (h2, h3, h4) или размещать текст в <div>, не обернув его тегом <p>.

Настройка ЧПУ

ЧПУ (Человекопонятный URL) — это адрес страницы сайта, который понятен не только поисковым роботам, но и людям. Он содержит слова, которые отражают тематику. Активируется во вкладке «Системная конфигурация», раздел называется «Дружественный URL».

Настройки для корректной работы ЧПУ:

  • Использовать вложенные URL.
  • Использовать SEO Strict URLs.
  • Не разрешать повторяющиеся псевдонимы.
  • Не добавлять слэш к контейнеру.
  • Не использовать AliasListing только для Папок.
  • Не использовать ссылки в формате XHTML.
  • Автоматически генерировать псевдоним.
  • Использовать псевдонимы в URL.

ЧПУ улучшают кликабельность ссылок: люди с большей вероятностью перейдут по ссылке, которую могут прочитать. Также дружественные URL помогают поисковым роботам понять тематику сайта, что улучшает ранжирование страницы в результатах поиска.

Ошибка 404

Ошибка 404, или «Not Found», — это стандартный HTTP-код, который возвращает веб-сервер, когда запрошенный ресурс не найден. Такое может произойти, если пользователь перешёл по несуществующей ссылке или ввёл неправильный URL-адрес.

Иметь отдельную страницу для отображения такой ошибки очень важно с точки зрения пользовательского опыта. Она позволяет гостю сайта понять, что произошла ошибка, а не сбой всего ресурса.

Для настройки страницы 404 нужно сначала её создать (с помощью шаблонов или онлайн-конструктора). Затем в настройках CMS MODx, в разделе «Сайт», указать идентификатор этого документа в поле «Страница ошибки 404».

Совет эксперта: на странице 404 можно разместить ссылки на популярные разделы, чтобы пользователь смог продолжить изучение сайта.

Файл robots.txt

Содержит инструкции для поисковых роботов, какие страницы индексировать можно, а какие нет. Правильно настроенный robots.txt оптимизирует работу краулеров и защищает конфиденциальные разделы сайта.

Важно! Перед созданием robots.txt необходимо включить ЧПУ ссылки в настройках MODx Revo. Это позволит роботам правильно индексировать структуру сайта.

Существует несколько способов создания robots.txt:

  1. В текстовом редакторе на компьютере создать файл и загрузить в корень сайта.
  2. Создать документ непосредственно в MODx Revolution и установить тип контента «txt».

В файле нужно отредактировать следующие директивы:

  • Закрыть от индексации папку cgi-bin:

Disallow: /cgi-bin

  • Разрешить индексацию обрезанных изображений из кэша. Если используется phpThumb:

Allow: /core/cache/phpthumb/*.jpeg

Allow: /core/cache/phpthumb/*.png

Allow: /core/cache/phpthumb/*.svg

  • Использовать Punycode для кириллических имён файлов/папок:

http://пример.рф/ → http://xn--e1afmkfd.xn--p1ai/

Файл sitemap.xml

Sitemap представляет собой XML-файл, содержащий данные о страницах и контенте. Основное назначение карты сайта — проинформировать поисковые роботы о структуре и его новом или обновлённом контенте. Благодаря этому роботы быстрее индексируют страницы.

Внимание! Ускорение индексации предлагают онлайн-сервисы. Например, SpeedyIndex бесплатно поднимает до 100 URL-ов в поисковой выдаче. Через 72 часа приходит отчёт, в котором указан процент ссылок в индексе Google.

Для создания sitemap в MODX Revolution используется сниппет pdoSitemap из пакета pdoTools. Чтобы сгенерировать карту сайта, нужно:

  1. Создать пустой документ с заголовком «Sitemap» и псевдонимом sitemap.xml.
  2. В настройках документа указать тип содержимого — XML, отключить редактор и поисковую индексацию.
  3. Если не настроено ЧПУ, заморозить URL документа как /sitemap.xml.
  4. В поле контента документа вставить вызов [[!pdoSitemap]].
  5. Опубликовать документ.

После этого sitemap будет доступна по адресу site.ru/sitemap.xml. Поисковики смогут проиндексировать её и быстрее обнаруживать новые страницы сайта.

Файл .htaccess

Контролирует доступ к файлам и директориям, организовывает перенаправления, кэширование. Для MODX этот файл ещё более важен, поскольку отвечает за корректную работу дружественных URL. При установке MODX на хостинг файл htaccess уже присутствует в корневой директории. Необходимо переименовать его в .htaccess для активации настроек.

Чтобы задействовать ту или иную директиву, нужно удалить символ # в начале строки. Однако это стоит делать обдуманно, не активируя всё подряд.

В .htaccess часто настраивают перенаправление с www, склеивают дубли главной страницы, организуют редирект с HTTP на HTTPS для повышения безопасности.

После выбора предпочтительного формата отображения домена (с www или без) можно настроить соответствующий редирект при помощи директив в .htaccess.

Оптимизация скорости загрузки сайта на MODx

Изображения являются основным фактором, влияющим на рендер страницы. Поэтому именно с них следует начинать оптимизацию.

Google рекомендует:

  • Устанавливать оптимальный размер изображений. Например, если ширина контентной области 800px, а загружаете изображение шириной 1980px — это лишняя нагрузка.
  • Явно указывать атрибуты width и height для тега img.
  • Использовать эффективные форматы, такие как WebP (не поддерживается некоторыми браузерами).
  • Откладывать загрузку невидимых на странице изображений.

Ещё рекомендуется объединять CSS и JS файлы в один, а затем разделять критически важные стили и скрипты.

Критические стили подключаются в head, они будут подгружаться раньше контента. Остальные — асинхронно в body.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *