форум Реклама в интернете

Форум eBanners.Ru: Реклама в интернете и раскрутка сайтов - форум по интернет-рекламе 
Зеркало сайта - как выбрать главный виртуальный хост из нескольких зеркал сайта (для поисковой системы Яндекс) - Поисковая оптимизация сайта и продвижение сайтов в поисковых системах - интернет-реклама
 РегистрацияРегистрация   ВходВход 
У вас есть вопрос по рекламе в интернете и раскрутке сайтов? Задайте его здесь и вам ответят.
Вы уже всё знаете? Помогите тем, кто знает пока не всё. Правила форума| Сделать стартовой|Добавить в избранное.

Реклама SU: продвижение сайта (ОПЛАТА за РЕЗУЛЬТАТ) и контекстная реклама на Яндексе без наценки.

Зеркало сайта - как выбрать главный виртуальный хост из нескольких зеркал сайта (для поисковой системы Яндекс)

 
   Список форумов Реклама в интернете -> Поисковая оптимизация сайта и продвижение сайтов в поисковых системах
Форум Раскрутка сайтов  
Автор Сообщение
Николай ПопковОффлайн
Admin
Зарегистрирован: 16.11.2004
Всего сообщений: 1052
Откуда: Волгоград
Возраст: 50
Пол: Мужской
12 Дек 2004 Вс 12:37   Зеркало сайта - как выбрать главный виртуальный хост из нескольких зеркал сайта (для поисковой системы Яндекс)

Зеркало сайта - как выбрать главный виртуальный хост из нескольких зеркал сайта (для поисковой системы Яндекс)

Если ваш сайт находится на одном сервере (одном IP), но виден во внешнем мире под разными именами (зеркала, разные виртуальные хосты), Яндекс рекомендует вам выбрать то имя, под которым вы хотите быть проиндексированы. В противном случае Яндекс выберет главное зеркало самостоятельно, а остальные имена будут запрещены к индексации.

Для того, чтобы индексировалось выбранное вами зеркало, достаточно запретить индексацию всех остальных зеркал при помощи файла robots.txt. Это можно сделать, используя нестандартное расширение стандарта robots.txt — директиву Host, в качестве ее параметра указав имя основного зеркала. Если www.reklama.su — основное зеркало, то robots.txt должен выглядеть примерно так:

Код:
User-Agent: *
Disallow: /forum
Disallow: /cgi-bin
Host: www.reklama.su



В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву Host необходимо добавлять в группе, начинающейся с записи User-Agent, непосредственно после записей Disallow.
Аргументом директивы Host является доменное имя с номером порта (80 по умолчанию), отделенным двоеточием. Если какой-либо сайт не указан в качестве аргумента для Host, для него подразумевается наличие директивы Disallow: /, т.е. полный запрет индексации (при наличии в группе хотя бы одной корректной директивы Host). Таким образом, файлы robots.txt вида

Код:
User-Agent: *
Host: www.reklama.su



и

Код:
User-Agent: *
Host: www.reklama.su:80



эквивалентны и запрещают индексирование как www.volchat.ru , так и www.reklama.su:8080 и news.reklama.su .
Параметр директивы Host обязан состоять из одного корректного имени хоста (т.е. соответствующего RFC 952 и не являющегося IP-адресом) и допустимого номера порта. Некорректно составленные строчки Host игнорируются.


# Примеры игнорируемых директив Host
Host: www.myhost-.ru
Host: www.-myhost.ru
Host: www.reklama.su:0
Host: www.my_host.ru
Host: .my-host.ru:8000
Host: reklama.su.
Host: my..host.ru
Host: www.reklama.su/
Host: www.reklama.su:8080/
Host: http://www.reklama.su
Host: www.mysi.te
Host: 213.180.194.129
Host: www.reklama.su,www.volchat.ru
Host: www.reklama.su www.volchat.ru


Если у вас сервер Apache, то можно вместо использования директивы Host задать robots.txt с использованием директив SSI:

Код:
<!--#if expr=" \"${HTTP_HOST}\" != \"www.ebanners.ru\" " -->
User-Agent: *
Disallow: /
<!--#endif --> 


В этом файле роботу запрещен обход всех хостов, кроме www.ebanners.ru

Как включать SSI, можно прочесть в документации по вашему серверу или обратиться к вашему системному администратору. Проверить результат можно, просто запросив страницы:

http://www.ebanners.ru/robots.txt
http://другое_имя.ru/robots.txt
и т.д. Результаты должны быть разные.

Рекомендации для веб-сервера Русский Apache
В robots.txt на сайтах с русским апачем должны быть запрещены для роботов все кодировки, кроме основной.

Если кодировки разложены по портам (или серверам), то надо выдавать на разных портах (серверах) РАЗНЫЙ файл robots.txt. А именно, во всех файлах robots.txt для всех портов/серверов, кроме «основного», должно быть написано:

Код:
User-Agent: *
Disallow: / 


Для этого можно использовать механизм SSI, описанный выше.
Если кодировки в вашем Apache выделяются по именам «виртуальных» директорий, то надо написать один robots.txt, в котором должны быть примерно такие строчки (в зависимости от названий директорий):

Код:
User-Agent: *
Disallow: /dos
Disallow: /mac
Disallow: /koi 



Как выяснить, что Yandex проиндексировал на моем сервере?

Подставьте ваш ресурс в форму на странице AddURL.

Если вы получили сообщение, что «Ваш URL __url__ был только что внесен в нашу базу данных.», это значит, что ваш URL ранее не был добавлен. Теперь он добавлен и будет проиндексирован в ближайшее время.
Если вы получили сообщение «Ваш URL __url__ уже известен роботу Яndex. Данный ресурс будет проиндексирован в ближайшее время.», то подождите еще пару дней.
Если вы получили сообщение «Ваш URL __url__ уже проиндексирован. Вы можете посмотреть, какие страницы вашего сайта проиндексированы в Яndex.Ru к настоящему времени», то, нажав на ссылку со слов «проиндексированы в Яndex.Ru», вы получите весь список документов вашего ресурса, проиндексированных в нашей поисковой машине.

____________

от себя добавлю, что форма добавления сайта в Яндексе (AddURL) сейчас находится по адресу http://webmaster.yandex.ru/
Вернуться к началу
View user's profile Посетить сайт автора 
Николай ПопковОффлайн
Admin
Зарегистрирован: 16.11.2004
Всего сообщений: 1052
Откуда: Волгоград
Возраст: 50
Пол: Мужской
12 Янв 2012 Чт 23:16   Зеркало сайта - как выбрать главный виртуальный хост из нескольких зеркал сайта (для поисковой системы Яндекс)

Если файла .htaccess в корневом каталоге сайта нет, то создайте его в текстовом редакторе. Если есть, то добавьте в него строки:

Редирект с домена без www на домен с www


Options +FollowSymLinks
RewriteEngine On
RewriteCond %{HTTP_HOST} ^ebanners\.ru$ [NC]
RewriteRule ^(.*)$ http://www.ebanners.ru/$1 [R=301,L]

или

Options +FollowSymLinks
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.(.*) [NC]
RewriteRule ^(.*)$ http://www.%1/$1 [R=301,L]


Наоборот с домена с www на домен без www

Options +FollowSymLinks
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.shot\.su$ [NC]
RewriteRule ^(.*)$ http://shot.su/$1 [R=301,L]

или

Options +FollowSymLinks
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www\.(.*) [NC]
RewriteRule ^(.*)$ http://%1/$1 [R=301,L]
Вернуться к началу
View user's profile Посетить сайт автора 
Показать сообщения:   
Форум Маркетинг и реклама
Бесплатный обмен ссылками
Лучшие партнерские программы
Партнерка по играм и бесплатные игры
Партнерская программа по знакомствам
Сайт знакомств и чат знакомств
Общение: форум и чат волчат
Куплю рекламу на вашем сайте
Программа раскрутки 1ps и Помощь в заполнении форм

Полезные сервисы: Мой ip адрес / My IP Address как узнать свой IP.
Бесплатная виртуальная клавиатура онлайн - русский, английский и другие языки.
Tранслит и перевод транслита.

агентство знакомств
ремонт фотоаппаратов

форум по интернет-рекламе