Creator87
Guest
Редактирование текста
Здравствуйте!
Необходима Ваша помощь.
Работаю сейчас над таким скриптом:
Он берет с интернет страницы её Исходный код и должен удалять из него все тэги, пустые символы и скрипты, то есть должен оставаться только текст, который выводится на странице.
Для этого написал такой вот код:
Он удаляет все тэги и пустое пространство нормально, но вот часть скриптов он оставляет, как есть.
Помогите найти ошибку на примере вот этой страницы:
http://www.drugs.com/hydrocodone.html
Ещё подскажите регулярное выражение для удаления текста между комментариями такого типа:
<!--
<какой-то текст>
// -->
Буду очень благодарен за помощь!
Здравствуйте!
Необходима Ваша помощь.
Работаю сейчас над таким скриптом:
Он берет с интернет страницы её Исходный код и должен удалять из него все тэги, пустые символы и скрипты, то есть должен оставаться только текст, который выводится на странице.
Для этого написал такой вот код:
PHP:
$fp = fopen("url", "r");
$t = fread($fp, 1000000);
$t = preg_replace ("!<script([^<]+)<\/script>!si", "", $t);
$t = preg_replace ("'<[\/\!]*?[^<>]*?>'si", "", $t);
$t = preg_replace ("'([\r\n])[\s]+'", "", $t);
Помогите найти ошибку на примере вот этой страницы:
http://www.drugs.com/hydrocodone.html
Ещё подскажите регулярное выражение для удаления текста между комментариями такого типа:
<!--
<какой-то текст>
// -->
Буду очень благодарен за помощь!
