solaris
Новичок
Регулярное выраженее. Помогите найти ошибку.
Добрый вечер!
Есть задача, найти сылку на заданный домен, определить на кукую страницу эта ссылка ссылается и с каким анкором.
Я совсем плохо еще понимаю регулярные выражения, прочитал много, из всего что понял(скорее всего недопонял), сделал вот такой шаблон:
Все работает в принципе нормально, и учитывает всевозможные методы составления ссылки, находит ссылку опредделяет с www она или без, также получает ее анкор, но вот со старницей куда ссылается эта ссылка проблемы
((
то есть вот в этом месте, послде $link_to(искомого домена):
сюда сваливается вся часть ссылки от конца имени домена до ">".
пример:
Выводит:
вторые сутки мучаюсь нкиак не пойму как сделать, что получить еще и страницу домена на которую ссылается ссылка
Заранее спасибо.
-~{}~ 30.01.09 23:14:
Короче 4 элемент в массиве просто хттп с двоеточием и слешем,(не знаю как написать, чтоб форум ссылку не вставлял туда)
-~{}~ 31.01.09 12:40:
ну, народ, ну помогите ж, хоть намекните
(( где мне искать помощи как не у вас
Добрый вечер!
Есть задача, найти сылку на заданный домен, определить на кукую страницу эта ссылка ссылается и с каким анкором.
Я совсем плохо еще понимаю регулярные выражения, прочитал много, из всего что понял(скорее всего недопонял), сделал вот такой шаблон:
PHP:
$pattern="/<a([^\>]*)(href\=(\'|\")?)(http\:\/\/)(www\.)?({$link_to})(.*)('|\")?([^\>]*)\>([^<\/a\>]*)<\/a\>/Usmi";
((то есть вот в этом месте, послде $link_to(искомого домена):
PHP:
(.*)
пример:
PHP:
$text=<<<END
|<hr>| asdadas dasds <A style='casdas' adsa='asdas' href=\"http://domain.com/bla/bla/bla\" target=\"_blank\">ankor 1,
ankor 2 </A> asdasdasdasd
END;
$link_to="domain\.com";
$pattern="/<a([^\>]*)(href\=(\'|\")?)(http\:\/\/)(www\.)?({$link_to})(.*)('|\")?([^\>]*)\>([^<\/a\>]*)<\/a\>/Usmi";
preg_match($pattern,$text,$ar);
print_r($ar);
PHP:
Array ( ..... [1] => style='casdas' adsa='asdas'
[2] => href="
[3] => "
[4] => h t t p : / /
[5] =>
[6] => domain.com
[7] =>
[8] =>
[9] => /bla/bla/bla" target="_blank"
[10] => ankor 1, ankor 2 )

Заранее спасибо.
-~{}~ 30.01.09 23:14:
Короче 4 элемент в массиве просто хттп с двоеточием и слешем,(не знаю как написать, чтоб форум ссылку не вставлял туда)
-~{}~ 31.01.09 12:40:
ну, народ, ну помогите ж, хоть намекните
(( где мне искать помощи как не у вас
))