Получение запароленного контента.

WaltDisney

Новичок
Получение запароленного контента.

Всем доброго времени суток.

Что-бы не утомлять формулирокой проблемы, я опишу то, что мне надо получить. Сразу замечу что мне не нужно готовое решение ( да и кто мне здесь его даст :D ), я хочу понять принцип как это сделать....

Возмем к примеру phpBB2, есть закрытая тема, контент которой можно получить только введя логин и пароль - т.е получив ID и куку в браузер. Попытка чтения этот страницы серверным скриптом через fopen, приведет к тому что скрипт считает не необходимый мне контент, а страницу с ошибкой.

Собственно вот и вопрос, каким образом можно заставить сервер все-таки прочитать этот контент ? Добавлю что у меня есть полный доступ к защащенной странице - и пара логин/пароль, и кука в браузере, первое я могу передать формой в скрипт, 2-е скрипт сам сможет считать...

Сервер свой Apache, конфигурировать могу как хочу. Удаленный тоже Apache.

Мои догадки насчет этой проблемы - надо считать необходимую инфу у пользователя ( куку ) , потом скриптом создать сокет с портом удаленного сервера, и каким то образом "запустить" в него этой кукой. Еще хочу добавить, что меня интересует только этот тип защиты инфы ( кука ) , так как IP личный совпадает с IP сервера.

И если моя догадка верна, то возможно ли формирование такого запроса, что-бы в ответ от сервера мне приходила только часть инфы ( от и до какого либо бита ) , Apache эту фичу поддерживает. Скорее всего такая инфа придет только в binary mode, тогда тут встает другая проблема, как её перевести в текстовой формат ?

К любителям отправлять RTFMить... Отправляете =) Но пожалуйста, толька на русские манулалы =)
 

WaltDisney

Новичок
Гм... А без cURL'a можно как нибудь обойтись ?
Рускоязычных учебников по libcurl просто я еще вообще не видел....
 

WaltDisney

Новичок
2 SiMM, спасибо за ссылочки, прочитал раз 10 и все равно не понял зачем они мне. Может Вы неправильно поняли мой вопрос ? Я не хочу что-бы мне обьясняли как пользоваться fsockopen для создания соединией, или обьясняли как разобраться с libcurl, я просто хочу узнать верно-ли мое предположение в принципе !!! Если верно, я сам разберусь с функциями и напишу скрипт, если нет, то просто хочу услышать принцип создания таких скриптов, их логическую структуру... Думаю это полностью соответствует именно этой части форума.
 

SiMM

Новичок
Значит плохо читали. Обсуждение вопросов кражи контента вообще запрещены правилами форумов. А такие банальности запрещены в этом подфоруме.
 

alexhemp

Новичок
WaltDisney

Все очень просто. Если браузер как программа может авторизоваться - то значит можно написать программу, которая сделает то-же самое.

Изучай как браузер взаимодействует с сервером.
 

WaltDisney

Новичок
2 SiMM Извиняюсь, где Вы увидели кражу контента ? У меня есть полный доступ к своей информации на удаленном сервере. Все это делаеться лишь для автоматизации процесса её получения. А насчет банальностей - это для кого как. Мне по крайней мере это еще рано называть это банальностью. Но если запрещены(!), то прошу модеров перенести тему.

2 alexhemp Как раз этим занимаюсь, но получается пока только создавать запросы без использования кукисов. А вот как прикрутить к этому кукисы для меня остаеться тайной...
 

Andreika

"PHP for nubies" reader
WaltDisney
кукисы можно прикрутить разными способами... обычно все зависит от того каким образом у тебя получается создавать запросы ... соответствующий кусок кода покажи, а мож кто посоветует как к нему кукисы прикрутить
 

WaltDisney

Новичок
Создаю запросы с помощью fsockopen, просто подставляя его(запрос) параметром к fputs...

Пример запроса

"GET /cgi-bin/memo.cgi?a=8453332&act=gen HTTP/1.0\r\nUser-Agent: Mozilla/4.0 (compatible; MSIE 5.0; Windows 98)\r\nRange:Bytes=5496-5504\r\nHost: somehost.ru\r\n\r\n"
 

Andreika

"PHP for nubies" reader
WaltDisney
ой, не помню что там HTTP/1.0 поддерживает, но не факт что все имеющееся

добавь в запрос Cookie: test=1;p=2;a=2\n
 

WaltDisney

Новичок
Всем спасибо кто помог, заработало ;)

Напоследок глупый ламерский вопрос =) Как отделить в ответе сервера header от самого контента ??? понимаю что регулярные выражения, но никак не дойду как именно...
 

SiMM

Новичок
Контент от заголовка отделяется одной "пустой строкой".
 
Сверху