И ни слова о том как они у тебя там вырезаются. Ну просто класс) Возьми замени этот тег на что-то другое, что не убирается твои парсером, а после - обратно.
в том то и дело что никак не вырезаются, это как я понял из прочитанного связанно с DOM.
И тут поможет или SimpleXML или рекурсивные функции. Но я в не силен в этом.
документ имеет такой вид
<result name="response" numFound="1" start="0">
<doc>
<str name="id">myDocumentId</str>
<str name="title">The title</str>
<str name="description">Keywords, keyword is highlighted.</str>
</doc>
</result>
<lst name="highlighting">
<lst name="myDocumentId">
<str name="title">The title contains <em>keyword</em></str>
<str name="description"><em>Keyword</em>s, <em>keyword</em> is highlighted.</str>
</lst>
</lst>