некорректная работа get_meta_tags

  • Автор темы AlexDreamer
  • Дата начала

AlexDreamer

Guest
некорректная работа get_meta_tags

get_meta_tags время от времени неточно выбирает
данные

пример, страница:
http://www.trade.guta.ru/analitic/default.asp

выбрано:

html - Д.Пономарев, Зименцкий А.К.
author - Зименцкий А.К., Рукавишников М.В.
robots - index,all
description -

хотя на странице точно есть keywords

<meta name = "keywords" content = "ONLINEBROKER GUTA ГУТА БРОКЕР ИНТЕРНЕТ-ТРЕЙДИНГ QUIK GUTABROKER АКЦИИ РТС ММВБ КУРС ГРАФИК КОТИРОВКИ ОН-ЛАЙН ДОВЕРИТЕЛЬНОЕ УПРАВЛЕНИЕ МОНТЕС-АУРИ ПАИ ПИФ ИНВЕСТИЦИИ FOREX FX ФОРЕКС FOREIGN EXCHANGE GUTA GUTABROKER BROKER RATE CHART EUR TRADE ЕВРО ИНТЕРНЕТ-ТРЕЙДИНГ АНАЛИТИКА ГРАФИКИ НОВОСТИ AFX КОТИРОВКИ JPY SWAP O/N T/N ГУТА ГУТА-БРОКЕР УСЛУГИ ">

Что за... нехорошая вещь? :(
 

MiRacLe

просто Чудо
<meta name ="_тут пробел(зачем?)_ keywords" ... >

видимо в этом дело - используй [m]preg_match_all[/m]
 

AlexDreamer

Guest
Я в регулярных не очень силен, помогите плиз составить
выражение для выборки значения name и/или content
из строки meta

только нужно учитывать что между name, =, и значением могут быть двойные кавычки, одинарные, пробел или вообще ничего.

нарисовал я тут (только не пинайте сильно)
preg_match("!name[ ]?=[ ]?[\"']?(.*?)[\"']?!si",$line,$value);

все работало пока значение было в кавычках, появился "безкавычечный" вариант и застрял я :(
 
Сверху