Парсеры на php(Теория, практика, примеры)

Статус
В этой теме нельзя размещать новые ответы.

craz

Нестандартное звание
Парсеры на php(Теория, практика, примеры)

Срочно надо подтянуть знания по парсингу html и иже сними в гугл отправлять не стоит проверял бана вроде нет
Нужны ссылки на теоретические статьи с большим кол-вом практических решений
Нужны ссылки на реальные задачи разбор html, xml, plain text - с помощью регулярок/стороних библеотек/dom/simple.
 

Adelf

Administrator
Команда форума
curl + регулярки.. и никаких статей. Зачем тебе теория то?
Мне как-то попадались такие таски - делал без всякой теории.
 

zbuilder

Новичок
а есть парсер части другого сайта (часть между определенными тегами находится)?
 

pilot911

Новичок
это все как-то сложно..

не проще ли попробовать либу tidy+phpQuery ( http://code.google.com/p/phpquery/ ) ?
 

craz

Нестандартное звание
такой вопрос, а как не качать всю страницу? то есть ну етсь урл но нужен один тег, как не качать себе для разбора весь html?
 

craz

Нестандартное звание
Автор оригинала: Вурдалак
fsockopen, ...
дирижабль

ну есть такая функция, как используя ее

1) инициировать несколько потоков соединения к серверу - оно же поточное?
2) как читать только нужные части страницы получаемые с помощью этой функции
 

Adelf

Administrator
Команда форума
craz
Ты серьезно считаешь, что можно скачать только нужный тебе тег?
c помощью fsockopen можно считать страницу до какого-то тега.. или какого-то другого условия. Но все равно придется считать все, что на этой странице до нужного тебе места.
 

iceman

говнокодер
да уж, с 2007 года а до сих пор не понимает как устроена и работает сеть, протокол http

craz
на стороне сервера по определенному запросу отдавай нужный хтмл =) если ты не воруешь контент...
 

craz

Нестандартное звание
сео долбанное...

iceman

да я то понимаю... просто не сталкивался вот и спрашиваю
 

pilot911

Новичок
давайте лучше проведем практикум по умной и законной уникализации статей каким-то автоматическим методом ? :)
 

fixxxer

К.О.
Партнер клуба
гугл транслейт на случайно выбранный язык и обратно, повторить N раз.

правда способу лет 10 )
 

G-SHEFF

Новичок
Если мы обращаемся с командой file_gets_contents, чтобы не прибегать к разбору страницу с помощью регулярных выражений, существует какая-то фишка определяющая url перед нами или нет, необходимо получить внешние
 

Mr_Max

Первый класс. Зимние каникулы ^_^
Команда форума
G-SHEFF
археолог
 
Статус
В этой теме нельзя размещать новые ответы.
Сверху