Боты важнее людей?!
Бывает, ищешь в поисковых системах что-нибудь. Вот перед тобой нужная ссылка, под ней выдержка из текста странички - ты нашёл, что искал. Каково же твоё удивление, когда при переходе на сайт обнаруживается, что требуется регистрация для просмотра содержимого.
Но бывает хуже - надпись на сайте гласит, что доступ к данной страничке доступен только для друзей блогера, или для сообщества. А на форумах - что “регистация завершена”, т.к. “набрано достаточно пользователей”, или веб2.0-евское “регистрация доступна только по приглашениям”.
Меня бесит не столько то, что я так долго искал это, что оно есть только на этом сайте, но я не могу его увидеть. Меня бесит, что этот контент спокойно индексировался поисковыми роботами.
Здесь может быть несколько вариантов:
- Робот читает не html, а rss-представление, это может быть блог или комментарии к нему (в таком случае мы ошибаемся, кликая по рез.поиска, т.к. думаем, что это сообщение из блога, который решили прочесть)
- Поисковики уже давно научились читать cookie (я, в своих скриптах, научился тоже). Что стоит один раз зарегистрироваться на популярном форуме, чтобы потом бот мог авторизироваться и просматривать сообщения. Позже, регистация может быть закрыта. А также, для поисковых систем админы форумов могут создавать аккуанты по просьбе или прося.

- Бот смотрит версию для печати, а ссылку даёт на полную версию. Направление осуществляется, например с помощью robots.txt. Также администатор форума/сообщества может использовать клоакинг для показа вместо сообщения авторизации страничку для индексирования.
Какой бы способ не использовался, случайно ли, или намеренно страничка оказалась в результатах поиска, в то время, как не может быть доступна для всех. У меня всё это вызывает просто ярость. Если уж контент доступен только избранным, то добавьте в robots.txt User-agent: * Disallow: / и избавьте людей от потери времени, бесполезно посещающих ваш сайт.
Для поисковых систем же, я бы предложил добавить возможность регистрации, после чего, можно было бы выбрать, на каких закрытых сайтах этот пользователь зарегистрирован.

мая 25, 2007 в 02:14
Только что нашёл по теме: http://izra.ru/2007/03/22/otnoshenie-k-lichnoy-infe/
мая 25, 2007 в 11:11
mrkto, прошло уже 2 месяца, а ситуация с моей статьей не изменилась. Принт-версия до сих пор доступна с поисковика.
августа 1, 2007 в 13:31
А вот пример с гугл-ботом: http://adsense.blogspot.com/2007/07/more-sleep-for-adsense-crawler.html
(в данном случе - для AdSense)
августа 21, 2007 в 17:34
да вы в кещ гугли смотрите
ноября 19, 2008 в 05:14
Тьфу ты, и правда плеваться хочется, глядя на все это безобразие… Не уважают живых людей.