Яндекс и PHPSESSID

Despod

Новичок
Яндекс и PHPSESSID

Доброго времени суток. Столкнулся с такой проблемой. При старте нового сайта сессия выставлялась абсолютно всем, Яндекс успешно проиндексировал все странички добавляя к ней &PHPSESSID=b281f3f33374838d6eadd49f24d763f8. Чуть позже для яндекса закрыли старт сессии, и в робот.тхт прописали Disallow: /*PHPSESSID*

по данным http://webmaster.yandex.ru

Страниц в поиске 16
Внешних ссылок на страницы сайта 160
Время последнего посещения сайта роботом 25.02.2010
Загружено роботом 1966
Исключено роботом 1010

Роботом как раз исключаются те ссылки которые в себе содержат PHPSESSID.

Цель: Что страниц в поиске стало не 16 а все те 1966.

Какие у меня мысли.

1) В робот.тхт убрать Disallow: /*PHPSESSID*. При переходе проверять значение PHPSESSID, проверить активно оно или нет(вот этот моент не знаю как проверить, подскажите). Если не активно то убивать эту ссесию и открывать новую для Человека.

2) Опять же проверить активна ли данная ссесия, и если не активна, то яндексу сказать ошибка 404, чтоб он в свою очередь понял что такой страницы нет, и убрал у себя эту ссылку с сессией.

Что я не могу сделать и хочу попросить у гуру помощи:
1) Как проверить значение PHPSESSID активно сейчас или нет, выставлено оно сегодня или месяц назад, в данном случае яндекс сохранил это у себя и любой человек входит я так понимаю под сессией открытой яндексом. Что вообще делать в такой ситуации?
2) Как в ответ не выдавая страницу сказать ошибка 404 файл не найден. И эфективно ли это будет для борьбы с яндексом?
 

Бочонок

http://frontender.info
1. Может просто отдать Яндексу sitemap с 1966 страничками?
2. PHPSESSID дописывается в ссылки и формы если не работают куки. Это можно отключить. Но не нужно. А проверить можно в настройках php. В том числе из скрипта. http://ua.php.net/manual/en/ref.info.php
3. не надо такого делать. Что не надо индексировать: запретите роботом. Что надо - не трогайте. И отдайте ему в карте сайта.
 

SiMM

Новичок
Если говорить о том, что не нужно - то ненужно стартовать сессии неавторизованным пользователям, или хотя бы не делать это посредством URI.
ИМХО, проще и безболезненнее для сайта переименовать имя сессионной переменной, а при наличии в URL переменной PHPSESSID делать безусловный редирект на ссылку без PHPSESSID.
 

Духовность™

Продвинутый новичок
нужно использовать только тогда, когда нужна 100% гарантия того, что пользователь без кук сможет адекватно работать. Например, в ситуации с какими-то транзакциями, денежными операциями, редактирование личных данных и т.д.

Это можно отключить. Но не нужно.
нужно. Если ваше веб-приложение, открытое для ПС дописывает PHPSESSID к каждой ссылке - это не правильно во всех смыслах.

-~{}~ 02.03.10 15:35:

хотя бы не делать это посредством URI.
да не надо вообще делать это посредством URI. Зайдите на любой сервис в интернете и увидите, что они не работают с отключенными куками.
 

SiMM

Новичок
> Зайдите на любой сервис в интернете и увидите, что они не работают с отключенными куками
Ну и что? Владелец сервиса самостоятельно решает, что ему нужно - главное, чтобы он чётко понимал, что к чему.
 

Бочонок

http://frontender.info
2SiMM:
Если говорить о том, что не нужно - то ненужно стартовать сессии неавторизованным пользователям,
Какое отношение сессия имеет к аутентификации пользователя?
Пользователи неаутентифицированы, но авторизироывны для доступа к странице. И сессия вполне может использоватся для обеспечения работы этого пользователя с сервисами нетребующими его аутентификации.

2triumvirat:
нужно. Если ваше веб-приложение, открытое для ПС дописывает PHPSESSID к каждой ссылке - это не правильно во всех смыслах.
Вы же сами написали чуть выше - это необходимо, если у пользователя не работают куки. Я понимаю, что вероятность этого исчезающе мала ... но к чему лишать себя страховки на этот, пусть маловероятный, случай? Помоему это имеет смысл делать только при условии, что твой сервис не способен функционировать без печенья в принципе. Как правило это не так.
 

Фанат

oncle terrible
Команда форума
Какое отношение сессия имеет к аутентификации пользователя?
вот ты до слова докопался, как пьяный до столба.
СУТЬ от твоего жонглирования словами меняется?

это необходимо, если у пользователя не работают куки.
никакой связи между висящими наружу PHPSESSID и неработающими куками нету.
если не докапываться к сказанному SiMM, а попробовать понять, что он сказал
 

Бочонок

http://frontender.info
2Фaнaт:
СУТЬ от твоего жонглирования словами меняется?
Насколько я понял он порекомендовал не стартовать сессию не залогиненым пользователям. И не очень понял почему так.
Эм ... я неверно понял, то что сказал SiMM?

если не докапываться к сказанному SiMM, а попробовать понять, что он сказал
Я вроде бы понимаю, что он говорит. Первая часть, о которой написано выше, вызвала у меня вопросы.
ИМХО, проще и безболезненнее для сайта переименовать имя сессионной переменной, а при наличии в URL переменной PHPSESSID делать безусловный редирект на ссылку без PHPSESSID
С этим я не спорю. Все верно.

никакой связи между висящими наружу PHPSESSID и неработающими куками нету.
В каких еще случаях, кроме неработающих кук, идентификатор сессии дописывается в формы и ссылки?
 

Бочонок

http://frontender.info
а какая тебе разница?
мне вот - никакой
Ты имеешь в виду:
В каких еще случаях, кроме неработающих кук, идентификатор сессии дописывается в формы и ссылки?
?
Так это я к тому что не работающие куки и то, что в ссылки и формы дописывается идентификатор сессии связано самым непосредственным образом.
И что отключать это, как правило, не следует.
 

Фанат

oncle terrible
Команда форума
никакой связи между висящими наружу PHPSESSID и неработающими куками нету.
пользователь прекрасно может работать ис отключенными куками
и при этом ничего наружу висеть не будет.
о чем симм и написал
 

Бочонок

http://frontender.info
***** поясни пожалуйста.

SiMM написал, насколько я понял, что можно переименовать переменную хранящую идентификатор сесии и если будет передана переменная с оригинальным именем - чистить от нее урл. Таким образом затрудняя подмену сесии (?).
Что именно я понял не верно и что имелось в виду? Поясни пожалуйста.

пользователь прекрасно может работать ис отключенными куками и при этом ничего наружу висеть не будет.
А как без кук и дописывания в href ссылок и формы будет передаватся идентификатор сессии? И соответственно поддерживатся сессия?
 

Фанат

oncle terrible
Команда форума
SiMM написал, насколько я понял, что можно переименовать переменную
все эти заморочки с яндексом к пхп отношения не имеют и меня не интересуют.
А как без кук и дописывания в href ссылок
а никто и не говорит, что не нужно дописывать
 

Despod

Новичок
Товарищи, вы немного увлеклись...

"1. Может просто отдать Яндексу sitemap с 1966 страничками?"
Ситемап есть, но яндекс постоянно приходит на сайт со соими сохранеными ссылками


2. PHPSESSID дописывается в ссылки и формы если не работают куки. Это можно отключить. Но не нужно. А проверить можно в настройках php. В том числе из скрипта. http://ua.php.net/manual/en/ref.info.php

Я не хочу отключать добавку PHPSESSID к ссылкам. Теперь в том случае когда на сайт заходит Яндекс, СЕССИЯ просто не стартуется, поэтому при заходе Яндекса по той же ссылке из ситемапа, исключено добавление сида к ссылке, но повторюсь, яндекс заходит по сохраненым у себя старым ссылкам.


Скажите лучше как проверить сид активный или нет? И как выдать на неактивный сид страница не найдена?
 

Despod

Новичок
Автор оригинала: triumvirat
нужно использовать только тогда, когда нужна 100% гарантия того, что пользователь без кук сможет адекватно работать. Например, в ситуации с какими-то транзакциями, денежными операциями, редактирование личных данных и т.д.
Мне нужно разделить ботов такие как яндекс, от живых людей. Для ботов будет эта ссеия или не будет абсолютно все равно, для Живых людей сессия обязательна. И то как она будет установлена, в кукисы или добавлена в ссылку мало интересно.
 

Бочонок

http://frontender.info
все эти заморочки с яндексом к пхп отношения не имеют и меня не интересуют.
Насколько я понял суть проблемы, Яндекс Бот не работает с печеньками и соответственно для него идентификатор сессии дописывается в ссылки и формы. Получив ссылку с идентификатором сессии в URL он ее "исключает".
И именно в том, что делать, и заключается вопрос.
Мне кажется что надо отдавать Яндексу карту сайта и пусть себе идентификатор сесии, как и должен, дописывается в случае необходимости в ссылки и формы. Так как сайт не для Яндекса а для пользователя.

SIMM предложил, насколько я понял, не стартовать сессию если пользователь не аутентифицирован. И тогда Яндекс Бот не получит ссылки с идентификатором сессии и не забракует их (по крайней мере те, которые доступны без аутентификации). Это сработает. Но так как пострадает accessibility то такое решение кажется мне неверным.

Что именно я не понял в том, что сказал SIMM?
Где я ошибаюсь?
 

Фанат

oncle terrible
Команда форума
когда кажется - креститься надо

-~{}~ 02.03.10 17:01:

для Живых людей сессия обязательна.
а вот и он - epic fail

accessibility страдает только в том случае, если для него используются сессии
 

Бочонок

http://frontender.info
Despod
Популярных ботов отлавливай по заголовкам.
Они себя вполне не двусмысленно обозначают.
Не популярных игнорируй.
 

Despod

Новичок
Автор оригинала: Бочонок
Насколько я понял суть проблемы, Яндекс Бот не работает с печеньками и соответственно для него идентификатор сессии дописывается в ссылки и формы. Получив ссылку с идентификатором сессии в URL он ее "исключает".
И именно в том, что делать, и заключается вопрос.
Мне кажется что надо отдавать Яндексу карту сайта и пусть себе идентификатор сесии, как и должен, дописывается в случае необходимости в ссылки и формы. Так как сайт не для Яндекса а для пользователя.

SIMM предложил, насколько я понял, не стартовать сессию если пользователь не аутентифицирован. И тогда Яндекс Бот не получит ссылки с идентификатором сессии и не забракует их (по крайней мере те, которые доступны без аутентификации). Это сработает. Но так как пострадает accessibility то такое решение кажется мне неверным.
Повторюсь, яндекс все НОВЫЕ ССЫЛКИ из СИТЕМАПА получает без сида, но входит он на сайт по СВОИМ РАНЕЕ СОХРАНЕНЫМ ссылкам. Мне интересно чтоб с Яндекса приходил народ на сайт, но приходил он по ссылке без сида.


Чтоб удалить ссылки в Яндексе, надо ему сказать, что страница более не существует. Т.е. проверить на активность сид, если сид не активен, то страница не найдена. Это реально?
 
Сверху