Вырезать таблицу со страницы регулярным выражением

vitaliy_11 · 28 Дек 2004

Вырезать таблицу со страницы регулярным выражением

Есть страница html

Приблизительная структура

<html> <h3>44444444444</h3>
<table width=\"1001\"><tr><td>rrrrrrrrrrr
<table width=1002> <tr><td>
<table width=1003>
<tr><td>
--------------------------------------------------------------------------
<table width=1004> <tr><td>
main text</td></tr></table>
---------------------------------------------------------------------------
</td></tr></table>
</td></tr></table>
</td></tr></table>
Выделенное надо получить

Знаю что в мне надо найти пятый по счету тэг <table> от начала - начало нужного текста

и окончание перед четвертым тэгом </table> с конца

Пишу регулярное выражение

PHP:

preg_match("!(<table.*?[^ >]+>.*?){5}(.*?)(<\/table>)!is", $text, $ok);

Открывающие тэги нормально ищет , а с закрывающими проблема

Может кто зает как это сделать?
Или какой другой способ подскажите.

nofx · 28 Дек 2004

PHP:

preg_match("/<table width=1004>.*?<\/table>/si",$a,$match);

vitaliy_11 · 28 Дек 2004

Дело в том что я не знаю что там точно <table width=1004>

и в этой таблице еще могут быть свои вложенные таблицы

Что я точно знаю, <table> по счету сверху и </table> по счету снизу, информацию между ними нужно получить

Cougar · 28 Дек 2004

С владельцем воруемого контента договориться не пробовал? Говорят, помогает

vitaliy_11 · 28 Дек 2004

Да я хочу с чужого сайта вставить контент в свой сайт (новости, ссылки).

Я может когдато и напишу это, но если кому не жалко то пожалуйста подскажите

_RVK_ · 28 Дек 2004

vitaliy_11
Контент воровать не хорошо. Даже, я бы сказал, подло.

Cougar · 28 Дек 2004

vitaliy_11
Я тебе уже сказал, какой наилучший вариант.

Обычно владельцы сайтов достаточно охотно идут на предоставление информации при условии, что будет указан их сайт в качестве источника.
Думаю, разобрать XML (как вариант - RSS) с заведомо известной структурой проще, чем городить невесть что в надежде на то, что у "воруемого" сайта не сменится дизайн.

vitaliy_11 · 29 Дек 2004

Все, сделал через строковые функции.

Всем спасибо!

Вырезать таблицу со страницы регулярным выражением

vitaliy_11

Guest

nofx

_

vitaliy_11

Guest

Cougar

Кошак

vitaliy_11

Guest

_RVK_

Новичок

Cougar

Кошак

vitaliy_11

Guest