Работа с regular expressions

itinvest

Guest
Работа с regular expressions

Есть сайт, на нем есть база :) Сайт поменял несколько хостингов, версий дизайна, доменных имен… Сейчас там творится ужас :)

В базе есть обзоры, пример обзора http://www.itinvest.ru/analytics/review/ittrader/54474/

Надо подобные обзоры (около 2000) их html-код надо почистить, навскидку такие вещи, как:
1. сейчас в сами обзоры дисклаймер (“Данный обзор имеет информационное назначение и не является …”) не вставляется, а раньше вставлялся прямо в текст, его надо выкинуть из всех обзоров.
2. удалить пустые теги из обзоров, типа <p> </p>

Так же надо по всему сайту пройтись – выяснить, куда ведут ссылки с сайта и узнать адреса картинок, используемых на сайте. Короче – надо сделать подборку по всем href и src.

Интересует стоимость. Срок - 3 ноября.

Предложения можно кидать в почту [email protected], аську 165616217 или на форум.

P.S. Из названия топика понятно, что надо работать с регекспом, а не вручную. Варианты, типа "2 бакса за страницу, хотя ладно, 1 бакс" не рассматриваются :)
 
Сверху