Выудить title-2

Ms

Новичок
Выудить title-2

Уже несколько дней безуспешно пытаюсь решить проблемму выуживания <title> из html-документа при помощи регулярных выражений.

Строковые функции тут не подходят, потому как в общем виде они не могут решить этот вопрос.


Был бы благодарен тому, кто направил бы меня на путь истинный, а также тем, кто уже решал подомную проблемму и торопится поделиться решением этой проблеммы с ближним своим.
 

neko

tеam neko
хотелось бы увидеть какое-нибудь подтверждение твоих напряженных усилий
 

SiMM

Новичок
Re: Выудить title-2

Автор оригинала: Ms
Строковые функции тут не подходят, потому как в общем виде они не могут решить этот вопрос.
Да неужели?
PHP:
$title = substr($str,strpos(strtolower($str),'<title>')+8);
$title = substr($title,0,strpos(strtolower($title),'</title>'));
Да, регулярником проще - но пока ты этого не можешь сделать - вполне сойдёт.
 

sakon

П..и.н..ок
Автор оригинала: Ms
< title >Заголовок </
title>
А если перед тем , что предложил SiMM считать файл в строку?;)
Вобщем то все равно в любом случае тебе придется убирать пробелы и переводы строки внутри тегов.

И еще - то так как ты написал - это нерабочий вариант. Этот тег у тя отображаться не будет. Так зачем на него закладываться?
 

Ms

Новичок
Откровенно говоря, всё это мне было нужно для следующего:
в моей статистике есть графа - переход по ссылкам.

И ссылки типа: http://yandex.ru/?$q=%20%20%20%20%20%20%20%20.

Я же хотел, чтоб парсер запрашивал содержимое всех страниц и выуживал из них <TITLE>.

Идея с треском провалилась.
Время, отведённое для запроса и парсинга HTML вышло ок. 1 мин.

Вот такой облом
 

Ms

Новичок
sakon
Не вижу повода для радости
Crys
Каждый день ко мне заходит ок 80 чел. с разных страниц на Яндекс, Рамбллер , Гоогл и др.
 

yugene

Отошел от дел
Originally posted by Ms
Crys
Каждый день ко мне заходит ок 80 чел. с разных страниц на Яндекс, Рамбллер , Гоогл и др. [/B]
А зачем все ссылки обрабатывать в одном запуске скрипта? А если их вдруг станет 800? Или 8000? Провалилась не идея, провалилась реализация.
 
Сверху