акуратно вычленить текст между тагами

Ganer

Новичок
акуратно вычленить текст между тагами

качаю хтмл страничку и пытаюсь вытащить текст между некого тага <xxx> и </xxx>, причем только между первым встреченым. весь хтмл читать не хочется, а побайтно оказалось низя - если читать по N байт можно нарватся на <xx
если склеивать, как-то сложно получается для элементарной задачки.
 

Ganer

Новичок
эт чо ? более 40К какого-то кода, что делает не написано. мне б просто в 2-х словах алгоритм как сделать не качая весь файл, а то вечно по пятница гениальный код получается :)
 

Demiurg

Guest
Неужели такая большая страница, что сложно её всю прочитать ?
 

tony2001

TeaM PHPClub
>что делает не написано
и внутри не написано?
а если почитать?
 

Ganer

Новичок
Setup is very simple. You need copy all files into someone catalog on your web server and after this call http://..../testhtmlparser.php
As result you will have start page of Russian PHPClub site which placed into the test.html file.
This page was formed by tag's tree after parse process. Bellow you can see printed tag's tree.
-----------
2Tony: или мне в коде копатся ???
/********************************************************************************************
* Parse grammar first step
********************************************************************************************
Parse
< [] [] >

in/state 0 1 2 3
< 1 -1 -1 1
[ -1 2 -1 -1
] -1 -1 1 -1
> -1 3 -1 -1
word -1 1 2 -1
EOF -1 -1 -1 -2

-2 end parse
0 begin parse, waiting '<'
1 got '<' need to parse parameters, or wait '>' or wait '['
2 got '[' or ']' need to parse parameters
3 got '>', waiting eof or '<'

после этого я потерялся в гениальной идеи :(

2Demiurg: понятия не имею ... и совершенно не хочется выяснять на сколько большая.

p.s. ясно идей нет буду склеивать по N байт.
 

Demiurg

Guest
>и совершенно не хочется выяснять на сколько большая.
ну раз те осознаешь масштаб задачи, то ничем не могу помочь.
 

Ganer

Новичок
похоже на описание масива ... то что он там возвращает меня мало интересует, интересует как. Или ты предлагаешь в свой код вот это вставить ???
Tony если там гениальная идея - расскрой, я ж специально запостил в новичковую ветку.
 

tony2001

TeaM PHPClub
Ganer:
я не понимаю твоего вопроса - что там не ясно?
он парсит ХТМЛ в массив.
стоит посмотреть как работает пример и все ясно.
если не ясно, то что конкретно?
 

Demiurg

Guest
tony2001, он боится файл целиком прочитать, а ты хочешь, что бы он еще его на парсинг отправил ?
 
Сверху