Технический подход к SEO (Часть 1)

nЭта статья представляет собой руководство по техническим аспектам поискового продвижения. Конечно, стоит помнить о том, что эффективность SEO зависит не только и не столько от технической стороны. Контент все еще имеет огромное значение. Даже если у вас все прекрасно настроено, без соответствующего наполнения вы вряд ли добьетесь успеха.nnnnnnnn
Основной домен (с www и без)
Основным доменом называется домен, который вы хотите использовать для индексации страниц вашего сайта. Он может быть указан как с www, так и без него. Проблема в том, что если вы не добавите в свой аккаунт оба варианта, выбранный вами адрес может не индексироваться. Поэтому важен не столько выбор адреса, сколько правильная настройка редиректа на выбранный URL.
Если вы используете Apache, самый простой способ это перенаправить все запросы на основной домен. Для этого нужно указать в файле .htaccess следующее:
Для перенаправления с домена с www на домен без www:
RewriteCond %{HTTP_HOST} ^www.site\\.com$ [NC]
RewriteRule ^(.*)$ http://site.come/$1 [R=301,L]
Если нужно сделать наоборот:
RewriteCond %{HTTP_HOST} ^ site\\.com$ [NC]
RewriteRule ^(.*)$ http:// www.site.come/$1 [R=301,L]
Если вы используете Nginx есть два способа решения этой задачи: неплохой и отличный. Неплохой значительно проще и требует только незначительного изменения конфигурации вашего сервера:
server {
...
if ($http_host != 'www.cronweekly.com') {
rewrite ^(.*)$ http://www.cronweekly.com$1;
}
}
Хотя этот способ работает, он не является оптимальным вариантом редиректа. Существует лучшее решение, но оно требует значительно большего количества изменений. Для перенаправления с домена без www на домен с www:
server {
listen 80;
server_name cronweekly.com alternativedomain.com;
return 301 http://www.cronweekly.com$uri;
}
server {
listen 80;
server_name www.cronweekly.com;
}
Первый блок содержит серверное имя, которое является альтернативой основному (www.site.com), но не должно быть использовано (site.com).
Выбирая между HTTPS и HTTP, стоит отдать предпочтение первому
Google отдает предпочтение сайтам с HTTPS и это влияет на ранжирование, пусть и незначительно. Поэтому если вы можете использовать HTTPS, сделайте это. Тем более, что некоторые хостинги предлагают своим клиентам бесплатные SSL-сертификаты.
Стоит отметить, что HTTPS не без изъянов, но правильная реализация позволит получить иконку зеленного замка в адресной строке. Будьте осторожны, любое нарушение, например объединение HTTPS и HTTP источников загрузки контента, лишит вас этого преимущества.
Если вы используете HTTPS, вы должны позаботиться о том, чтобы все запросы к HTTP перенаправлялись на ваш основной домен. Иначе вы можете обнаружить, что поисковики индексируют два сайта.
Если вы используете Nginx как обратный прокси-сервер для Apache (что является обычной практикой, если вы хотите подключить HTTP/2), вы можете использовать следующие настройки в вашем .htaccess файле:
RewriteEngine On
RewriteCond %{HTTPS} off
RewriteRule (.*) https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
Для Nginx вы можете использовать вариацию перенаправления, описанного выше. Виртуальный хост, который слушает порт :80, перенаправляет все запросы на порт :443 (HTTPs).
server {
listen 80;
server_name cronweekly.com www.cronweekly.com;
# Перенаправляем все на HTTPs
return 301 https://www.cronweekly.com$uri;
}
server {
listen 443 ssl;
server_name www.cronweekly.com;
}
Если вышеописанные операции выполнены должным образом, все запросы к вашему домену будут перенаправляться на его версию с HTTPs.
Скорость
Google предлагает прекрасный инструмент для тестирования: PageSpeed.
Быстрый сайт будет лучше ранжироваться, чем его медленный конкурент. Несмотря на то, что как и в случае с HTTPs, эта разница довольно небольшая, пользователи по достоинству оценят ваши старания.
Если вы используете Apache, вы можете заставить ваш статичный контент (CSS, JavaScript, изображения) сохраняться в КЭШе на протяжении двух недель. Добавьте в ваш .htaccess:
<IfModule mod_headers.c>
<filesMatch \"\\.(ico|pdf|flv|jpg|jpeg|png|gif|js|swf|css)$\">
Header set Cache-Control \"max-age=1209600, public\"
</filesMatch>
</IfModule>
Если вы уверены в том, что каждый элемент вашего сайта может быть кэширован, вы можете удалить блок filesMatch и задать эти настройки для всего контента.
На nGinx это будет выглядеть так:
server {
..
location ~ \\.(jpg|jpeg|png|gif|ico|css|js)$ {
expires 14d;
}
}
Корректные мета-теги: title и description
Это очевидно, но довольно часто о них просто забывают из-за наплыва рутинной работы. На самом деле, эти элементарные элементы критичны для продвижения вашего сайта.
<HTML>
<title> Mailing List Archive - MARC</title>
<meta name=\"description\" content=\"A public mailing list archive for open source projects.\">
...
Каждая страница должна иметь уникальные чистые title с правильным содержанием. Это ваш билет на SERPs (страницы результатов поисковой выдачи). Title и description должны бросаться в глаза и мотивировать пользователей перейти на ваш сайт.
Семантическая разметка страниц
Используйте HTML-элементы правильно. H1 для заголовка самого высокого уровня, h2 для подзаголовков и т.д. Поисковые боты используют эти элементы для определения последовательности анализа ваших страницы и ранжирования важности их содержимого.
Если речь идет о сайте-афише, вы можете добавить структурированные данные в разметку: они будут распознаны и показаны прямо на странице поисковых результатов.
Исключите дублирование контента
Поисковикам не нравится, когда один и тот же контент отображается на разных страницах. Основной причиной такого отношения является то, что дублирование контента очень часто используют для искусственного увеличения содержимого сайта.
На самом деле довольно легко столкнуться с ненамеренным дублированием контента. Например:
Эти ссылки могут указывать на одну и ту же страницу за счет изменения переменных составляющих адреса, а для поисковика это три уникальных URL. Такая ситуация типична для сайтов с полем поиска. Конечно, это проблему можно решить, но лучше попытаться ее избежать еще на стадии проектирования. У вас есть два варианта:
- Запретить индексирование \"лишних\" страниц;
- Настроить постоянную переадресацию (301) на конечный корректный адрес.
Чистые URLs
Пару лет назад большинство ссылок выглядело примерно так:
- site.tld/page.php?page_id=512
- site.tld/profile.php?id=12
- site.tld/forumpost.php?thread=66
- site.tld/profile.php?id=12
Сейчас такой тип ссылок встречается значительно реже. Адреса теперь выглядят вот так:
- site.tld/9-ways-to-make-money-online
- site.tld/profile/mattias-geniar
- site.tld/forum/thread/how-do-i-undelete-a-file-in-linux
- site.tld/profile/mattias-geniar
Такой подход к формированию ссылок имеет два преимущества:
- Очевидна информационная архитектура сайта;
- Ссылки содержат ключевые слова и позволяют приблизительно представить содержимое страницы, не открывая ее.
Очевидно, что второй вариант формирования адресов страниц предпочтительней с точки поискового продвижения, так как позволяет передать необходимую информацию поисковым ботам и информирует пользователя на этапе знакомства с ссылкой на странице поисковой выдачи.