парсер html

IliaK · 16 Июл 2006

парсер html

Первый раз в жизни пишу парсер. Нужно из html-кода выделить заголовки (т.е. всё, что находится внутри тега <title>).

попробовал сделать так:

PHP:

<?php
$prodfile=readfile("file"); 
$title=preg_grep("#<title>(.*)</title>#", $prodfile);
echo $title[0];
?>

Однако он возвращает весь введённый текст.
Подскажите, пожалуйста, как это лучше реализовать.
Документацию уже читал.

donflash · 16 Июл 2006

preg_match_all

insidex · 16 Июл 2006

<?php
$prodfile=readfile("file");
preg_match_all("#<title>(.*)</title>#", $prodfile,$title);
echo $title[1][0];
?>

IliaK · 16 Июл 2006

insidex

по-прежнему отдаёт то, что было на входе

donflash · 16 Июл 2006

Опиши подробней проблему...

insidex · 16 Июл 2006

IliaK

скинь сюда пожалуйста $podfile.

0xHH · 16 Июл 2006

PHP:

$prodfile=file_get_contents("body.html"); 
preg_match("^<title>(.*)</title>^", $prodfile,$array);
print_r($array);

Вывод:

Array ( [0] => [1] => aaaaaaaaaa )

WP · 16 Июл 2006

Вам надо в цирке выступать))) С номером "сколько нужно участнегов пхпклуба чтобы написать пару строк?".
Итак приступим к разносу.
donflash
> preg_match_all
Мимо.
insidex

$prodfile=readfile("file");
preg_match_all("#<title>(.*)</title>#", $prodfile,$title);
echo $title[1][0];

Ты знаешь что возвращает функция readfile?
> скинь сюда пожалуйста $podfile.
Отжиг засчитан. А потом по нему сделал бы substr, да?
IliaK

PHP:

$data = file_get_contents('http://phpclub.ru/talk/showthread.php?s=&postid=630671#post630671');
preg_match('~<title>(.*?)</title>~si',$data,$matches);
$title = isset($matches[1])?$matches[1]:'';
var_dump($title);

insidex · 16 Июл 2006

я всего лишь подправил преги, что выше не смотрел

IliaK · 16 Июл 2006

WP

Спасибо

Я чуть упростил:

PHP:

<?php
$data = file_get_contents('http://phpclub.ru/talk/showthread.php?s=&postid=630671#post630671);
preg_match('~<title>(.*?)</title>~si',$data,$matches);
echo $matches[1];
?>

WP · 16 Июл 2006

insidex
Дык перед постом надо проверять работоспособность)
IliaK
Ты не упросил, а изменил. Подумай что будет если регулярное выражение не будет найдено. Получишь Notice. Тебе это надо?

парсер html

IliaK

Новичок

donflash

Вареник клуба

insidex

флихтэръер

IliaK

Новичок

donflash

Вареник клуба

insidex

флихтэръер

0xHH

Новичок

WP

^_^

insidex

флихтэръер

IliaK

Новичок

WP

^_^