Неправильные ссылки

bomg

Guest
Неправильные ссылки

Привет парни!

В документе текст со ссылками.

"<a href="http://123.ru/xxхxxx.htm">123</a>" - "правильная"
"<a href='http://123.ru/xxхxxx.htm'>456</a>"- "неправильная"

Разница только в этих " и ' внутри тега.
Названия документов (хххххх) разные - разное количество символов (именно символов, буквы, точки, цифры, и.т.д)
Нужно сие вылечить, то есть сделать "правильными".
Никак не разберусь что писать в $pattern - все ссылки с разным содержимым и разной длины.
Поможете?
Спасибо!
 

DimbIch

Новичок
ну тебе надо регексп написать...
$pattern = '#<a href=(\')(?:[^\'])*(\')>#';
ну что то типа того.....
хотя надо смотреть контент который надо менять подробнее...
 

bomg

Guest
Originally posted by DimbIch
ну тебе надо регексп написать...
$pattern = '#<a href=(\')(?:[^\'])*(\')>#';
ну что то типа того.....
Хе-хе! Понятно что "типа":D А вот что?

В квантификаторах ничего не накопал...
А так не получится?
$pattern = "<a href='http://www.123.ru/_ пофигу чего и
сколько_.html>";
Только что писать вместо "_ пофигу чего и сколько_"?
 

SelenIT

IT-лунатик :)
"пофигу_чего_и_сколько" записывается ".*"

Но здесь не совсем "пофигу чего", а "сколько угодно любых символов, кроме одиночной кавычки", т.е. как минимум "[^']*". А еще строже, в URL могут встречаться далеко не любые символы (пробелы, русские буквы, те же кавычки и т.п. - отпадают).
 

DimbIch

Новичок
bomg
я тебе принцип действия показал...
а ты почитай доки по regexp
хотя бы это http://www.perldoc.com/perl5.6/pod/perlre.html
это для перла но разницы никакой....
 

SelenIT

IT-лунатик :)
на самом деле небольшая разница есть, в разделе php-мана по синтаксису и функциям [m]PCRE[/m] она оговаривается, так что смотреть лучше там :)
 

Breeze

goshogun
Команда форума
Партнер клуба
SelenIT
в URL могут встречаться далеко не любые символы (пробелы, русские буквы, те же кавычки и т.п. - отпадают)
ты в этом на 100% уверен?
 

SelenIT

IT-лунатик :)
Breeze, конечно, законы не запрещают такие символы туда вписать :) но я имел в виду реально работающие нелокальные ссылки. Если бы любые символы допускались, не было бы необходимости в URL-кодировании...
 

bomg

Guest
Originally posted by Breeze
SelenIT


ты в этом на 100% уверен?
Абсолютно! Просто ока копался с PHP забыл замечательную штуку в HTML. Comment называется<!-- --> :) Уж ему-то точно пофиг чего и сколько.
 
Сверху