Поиск в HTML документе ссылок

Dmitr

Новичок
В этом то и прикол что http://domain.com/.../ может не быть, а только src="file.html" и надо все фреймы обработать.
Вот в чём суть проблемы...
 

ELLO

Guest
Код:
/<iframe.*?src.*?=.*?\"(http:\/\/[a-z\-_]+.[a-z]{2,3}|).*\/([^\"]*)\"/is
 

SelenIT

IT-лунатик :)
Dmitr
Зачем же прописывать в регулярке то, чего может не быть? Аналогичная регулярка для <img...> вроде бы работала без всякого '(http://)'?
 

Dmitr

Новичок
Обрезало, только самый последный фрейм:
Array
(
[0] => Array
(
[0] => <iframe shit=10 src="file.html"> zzz zzz zzzz<iframe ... ... src="http://blabla.ru/zzz/file.html"> shit shuit <iframe ... ... src="http://ggg.uauaua/xxx/megahtml.php"
)

[1] => Array
(
[0] =>
)

[2] => Array
(
[0] => megahtml.php
)

)
 

ELLO

Guest
PHP:
preg_match_all("/<iframe.*?src.*?=.*?\"(.*\/|)([^\"\']+)\".*?>/is", $data, $found);
можно и свои мозги немного поюзать...

-~{}~ 08.08.05 16:53:

чет я затупил
так луче:
PHP:
preg_match_all("/<iframe.*?src.*?=.*?\"([^\"]*\/|)([^\"]+)\".*?>/is", $data, $found);
 

Dmitr

Новичок
Да вот тоже сидели, и придумали это:
preg_match_all('/iframe.*".*([^\/]*)"/Ui', $str, $res);
:)

-~{}~ 08.08.05 20:44:

PHP:
preg_match_all('/iframe\s.*src=".*([^\/]*)"/Ui', $file, $iframe_local);
Так лучше.
 
Сверху