Улучшаем индексацию: присутствие в ссылке ".php?" - знак "?" проблема или нет?

mike_S

Новичок
все поисковики безо всяких проблем индексируют динамические страницы, сформированные без помощи mod_rewrite, то бишь со знаком "?"
 

Torio

Guest
Всем спасибо! :)
Мыслей для обдумывание более чем предостаточно! Mod_rewrite - вот мое решение. как реализовать смотреть здесь: http://sitemaker.ru/technologies/webserver/mod_rewrite/
я сделал так:

в .htaccess пишем:

RewriteEngine On
Options +FollowSymlinks
RewriteBase /
RewriteRule ^(.*)-ea=(.*)$ $1.php?$2

В коде сайта: "www.exsample-ea=smth", соответственно понимается броузером как "www.exsample.php?smth".
 

CCCP_MOCKBA

Новичок
поисковик не должен индексировать страницу если она не отлична от основной по содержанию в TITLE и/или META, а урлы со знаком "?" читаются и понимаются роботом нормально )
 

DiTHER

bang bang
Автор оригинала: CCCP_MOCKBA
поисковик не должен индексировать страницу если она не отлична от основной по содержанию в TITLE и/или META
meta и title нужны для описывания отдельно взятых страниц, а не всего сайта. В противном случае их применение не несёт за собой абсолютно никакой информационной нагрузки (т.е. бессмысленно).
 

Torio

Guest
Господа, хватит уже друг на друга напирать! :)
Решение найдено, если кто-нибудь не согласен с таким способом убирать знаки вопроса из ссылок, то пишите, а title и meta здесь вообще ни при чем.
Вопрос не был задан так: как правильно заполнить мета-данные для хорошей индексации сайта...
Это уже совсем другая тема :)
P.S. если кому-то форум нужен просто для общения, а не решения вопросов - заведите асю, ЖЖ, мыло... ;)
 

Silent

Новичок
Автор оригинала: nikit87
SiMM
ну почему же. вроде из русских только рамблер решил эту проблему и то говорят коряво. яндекс до сих пор подглючивает с этим
Слышал звон, да не знает, где он. Как раз у Яндекса (равно как и у Гугля) никогда не было проблем со знаком вопроса в УРЛ. А у Рамблера были, достаточно долго. Оттуда и пошло мнение о вреде "?". Но сейчас и Рамблер исправился.
 

baev

‹°°¬•
Команда форума
Автор оригинала: CCCP_MOCKBA
Сайте на котором значения тагов META и TITLE будут одинаковы на всех страницах, поисковиком проиндексируется только первая страница.
-- бред.

Набираем в yandex phpsessid (кстати, к вопросу о знаках вопроса в урле).

Смотрим третью позицию в найденном.
Переходим по ссылке Ещё с сайта (432)
И смотрим тайтлы и дискрипшены.
 

Crazy

Developer
Автор оригинала: CCCP_MOCKBA
Сайте на котором значения тагов META и TITLE будут одинаковы на всех страницах, поисковиком проиндексируется только первая страница.
Бред.
 

deek

Новичок
есть мнение, что google индексирует ~ в 5 раз интенсивнее (т.е. индексирует за один заход больше страниц), если дать ему понять, что он имеет дело со статикой. точно ручаться не могу, но мы пару раз делали такие трики, и получали существенный прирост в объеме страниц в индексе google и скорости их попадания туда.

отчасти, тут об этом написано (п.2.2.):
http://www.google.com/webmasters/2.html

можно сделать, чтобы все ссылки имели вид:
http://example.com/articles/id-1.html
или
http://example.com/catalog/category-1/sortby-1/page-7.html

и в приложении мы бы получали массив (для последнего примера):
array(4)
{
"catalog" => true,
"category" => 1,
"sortby" => 1,
"page" => 7
}

делается при помощи mod_rewrite и php - как собственно, и все возможные другие извращения над url.
 

SibProgrammer

Новичок
По поводу преимущества mod_rewrite над знаком ворпоса по отношению к Яндексу - могу рассказать одну историю...
Несколько месяцев назад обратил внимание, что один из сайтов имеет большое кол-во посетителей, хотя является очень узко спецеализированным и содержит всего около сотни статей. Разглядывание логов показало, что самый частый посетитель - это бот Яндекса. Он запрашивает в неделю около 40 тыс. страниц, что составляет 99,99 % всех запросов к данному сайту! :)
У юзера стоит tikiwiki и бот Яндекса, в основном, идет по страницам модуля календаря! :) Т.е. по УРЛам вида xxx.php?date=20051210 или что-то в этом духе - сейчас уже точно не помню.. Причем все остальные боты (Рамблер, Гугл, МСН) - такой фигней не страдают...
Выводы делайте сами :)
 

Silent

Новичок
SibProgrammer А будь там mod_rewrite, что изменилось бы? Робот так же ходил бы по ссылкам вроде xxx/2005/12/10
Видимо у Яндекса не настолько жесткий фильтр на подобные черные дыры, как у других поисковиков. Либо по какой-то причине именно в данном конкретной случае фильтр не сработал и робот зациклился (если это происходит уже давно, я бы написал в саппорт). Но в сети столько подобных мест, что совсем без фильтра ни один большой поисковик не выживет, весь индекс будет заполнен календарями и прочими подобными местами. Я сам однажды создал на сайте бесконечный цикл и заметил только через пару недель, по логам. Но ни Яндекс, ни Гугль сильно не зациклились, всего по тысяче страниц проиндексировали примерно, потом я эту область сайта закрыл от роботов.
 

SibProgrammer

Новичок
Silent
Я как раз и имел ввиду то, что, имхо, не особо важно - вопросы или mod_rewrite и, поэтому не стоит считать 100% лучшим один из этих способов... Тем более, что если уж на то пошло, то index.php?mod=show_order не намного хуже чем просто /show_order/
 
Сверху