itinvest
Guest
Работа с regular expressions
Есть сайт, на нем есть база
Сайт поменял несколько хостингов, версий дизайна, доменных имен… Сейчас там творится ужас 
В базе есть обзоры, пример обзора http://www.itinvest.ru/analytics/review/ittrader/54474/
Надо подобные обзоры (около 2000) их html-код надо почистить, навскидку такие вещи, как:
1. сейчас в сами обзоры дисклаймер (“Данный обзор имеет информационное назначение и не является …”) не вставляется, а раньше вставлялся прямо в текст, его надо выкинуть из всех обзоров.
2. удалить пустые теги из обзоров, типа <p> </p>
Так же надо по всему сайту пройтись – выяснить, куда ведут ссылки с сайта и узнать адреса картинок, используемых на сайте. Короче – надо сделать подборку по всем href и src.
Интересует стоимость. Срок - 3 ноября.
Предложения можно кидать в почту [email protected], аську 165616217 или на форум.
P.S. Из названия топика понятно, что надо работать с регекспом, а не вручную. Варианты, типа "2 бакса за страницу, хотя ладно, 1 бакс" не рассматриваются
Есть сайт, на нем есть база


В базе есть обзоры, пример обзора http://www.itinvest.ru/analytics/review/ittrader/54474/
Надо подобные обзоры (около 2000) их html-код надо почистить, навскидку такие вещи, как:
1. сейчас в сами обзоры дисклаймер (“Данный обзор имеет информационное назначение и не является …”) не вставляется, а раньше вставлялся прямо в текст, его надо выкинуть из всех обзоров.
2. удалить пустые теги из обзоров, типа <p> </p>
Так же надо по всему сайту пройтись – выяснить, куда ведут ссылки с сайта и узнать адреса картинок, используемых на сайте. Короче – надо сделать подборку по всем href и src.
Интересует стоимость. Срок - 3 ноября.
Предложения можно кидать в почту [email protected], аську 165616217 или на форум.
P.S. Из названия топика понятно, что надо работать с регекспом, а не вручную. Варианты, типа "2 бакса за страницу, хотя ладно, 1 бакс" не рассматриваются
