Извлечь текст из ссылки

aleks_lv

Новичок
Доброго
есть такой хтмл
HTML:
<li class="gl l0 nost">
    <a href="/link/gl9/"><b>Глава 9.</b> Текст</a>
    <div class="law-item-preview"></div>
</li>
<li class="st l1">
    <a href="/link/134/"><b>Статья 134.</b>Текст</a>
</li>
как получить текст <<<b>Глава 9.</b> Текст>> из этой ссылки
Код:
<a href="/link/gl9/"><b>Глава 9.</b> Текст</a>
есть выражение которое ищет все ссылки
PHP:
$page = $this->getContent($url);
$regexp = "<a\s[^>]*href=(\"??)([^\" >]*?)\\1[^>]*>(.*)<\/a>";
preg_match_all("/$regexp/siU", $page, $matches1);
var_dump($matches1[3]);
специалист в данной области не большой
поэтому не знаю как вставить именно конкретную ссылку
PHP:
'/\S{1,}/gl\d+/'
спасибо
 

fixxxer

К.О.
Партнер клуба
Щас xhtml уже не модно, вряд ли распарсится все целиком xml-парсером. Не, ну можно через tidy прогнать, каэш
 

grigori

( ͡° ͜ʖ ͡°)
Команда форума
пишут, что DOMDocument::loadHTML в целом работает с немного битым html
 
Сверху