knight
Новичок
pcre грабинг
Добрый дней
есть rss
и ругулярка для грабинга статей с этого рсс
проблема в том что с некоторых постов данная регулярка не забирает текст, хотя структура страниц практически одинакова, например этот http://www.iht.com/articles/2008/09/05/business/soft.php
в чем может быть загвоздка? зарание благодарен за ответ
Добрый дней
есть rss
и ругулярка для грабинга статей с этого рсс
PHP:
@
id="main">.+?
<h1\sclass="headline">(?<title>.+?)</h1>.+?
(?:<[^<]*?id="bodyText"[^>]*?>)
(?<text>.+?)
(?:<[^<]*?id="article_footer"[^>]*?>)
@isxu
в чем может быть загвоздка? зарание благодарен за ответ