sCRiPt.php
Новичок
Парсер ссылок из HTML-документа
Привет всем. Задумал написать парсер ссылок, но с рег. выражениями у меня плохо ;(
Теории говорить не буду, лучше расскажу принцип:
Есть ссылка вида http://sharebee.com/6153532c на которой находится пять ссылок на файлообменники, они то мне и нужны! Вот предпологаемый код:
Нужно чтоб выводилось: (желательно в таком порядке)
http://depositfiles.com/files/cdzs8abh1
http://rapidshare.com/files/257488347/Midnight_Without_You__1997_.txt.html
http://www.zshare.net/download/6286842157d5e67c/
http://www.badongo.com/file/16073697
http://www.megaupload.com/?d=U7JKFSGK
Заранее благодарен за помощь.
PS. Сильно не бейте и помидорами не кидайтесь, я НЕ php-программер
Привет всем. Задумал написать парсер ссылок, но с рег. выражениями у меня плохо ;(
Теории говорить не буду, лучше расскажу принцип:
Есть ссылка вида http://sharebee.com/6153532c на которой находится пять ссылок на файлообменники, они то мне и нужны! Вот предпологаемый код:
PHP:
<?php
$open = @file_get_contents("http://sharebee.com/6153532c", "r");
$link = ('#<a\s[^>]*href=(\"??)([^\" >]*?)\1[^>]*>(.*)<\/a>#is'); // вот тут-то и проблема, не могу составить правильное выражение
preg_match_all($link,$open,$out);
// тут можно использовать цикл for
@header("HTTP/1.0 200 OK");
@header("HTTP/1.1 200 OK");
@header("Cache-Control: no-cache, must-revalidate, max-age=0");
@header("Expires: 0");
@header("Pragma: no-cache");
@header("Content-type: text/css; charset=windows-1251");
echo $linkz."<br />";
?>
http://depositfiles.com/files/cdzs8abh1
http://rapidshare.com/files/257488347/Midnight_Without_You__1997_.txt.html
http://www.zshare.net/download/6286842157d5e67c/
http://www.badongo.com/file/16073697
http://www.megaupload.com/?d=U7JKFSGK
Заранее благодарен за помощь.
PS. Сильно не бейте и помидорами не кидайтесь, я НЕ php-программер
