Разбор HTML и стиь из внешней CSS

Itonix

Новичок
Разбор HTML и стиь из внешней CSS

Задача такова.
Предположим мы имеем исходный текст сайта (забранного curl`ом, например), внутри которого содержится <div id="my_div"><a href="/123">my link</a></div>
в внешней CSS (ссылка на которую имеется в исходном тексте сайта, и забрать которую не проблема) прописано (для примера)
div{
color:#ccc;
}
#my_div{
font-size: 12px;
}
#my_div a{
font-weight:bold;
}

необходимо получить скомпилированный стиль для A внутри DIV
то-есть как-то получить что стиль A будет
font-weight:bold;
font-size:12px;

я пробовал SimpleHtmlDom и phpQuery , но они могут вернуть стиль только если он напрямую прописан в HTML (<div style="...">) как свойство аттрибута style.
грубо говоря необходимо как-то эмулировать работу браузера, что-бы узнать как в результате будут выглядеть стили.

возможно ли вообще такое реализовать? (Google же как-то узнает что некоторые ссылки на странице скрыты от глаз пользователя тем-же display:none и не идексирует их)
 

tenshi

Новичок
можно попробовать так:
натравливаем на хтмл domdocument
парсим цсс, сортируем в соответствии со специфичностью селекторов, разворачиваем сокращённые формы записи стилей в подробные, селекторы преобразуем в xpath и с его помощью находим элементы, в которые инлайним стили из правил, чистя дубликаты.
 

Crys

Двинутый новичок
насколько мне известно, diplay:none гугль отлично индексирует... хотя бы потому, что внутри display:none могут быть элементы, отображающиеся по событию (выпадающее меню и т.п).

кому надо, тот и через javascript скроет элементы.. поэтому гугл определяет поисковой спам и дорвеи другими способами, нежели парсинг css :)

-~{}~ 11.10.10 13:22:

Проверил, я ошибся. Контент с инлайновым display:none гугл не индексирует.
 
Сверху