И ни слова о том как они у тебя там вырезаются. Ну просто класс) Возьми замени этот тег на что-то другое, что не убирается твои парсером, а после - обратно.
		
		
	 
в том то и дело что никак не вырезаются, это как я понял из прочитанного связанно с DOM.
И тут поможет или SimpleXML или рекурсивные функции. Но я в не силен в этом.
документ имеет такой вид 
<result name="response" numFound="1" start="0">
   <doc>
      <str name="id">myDocumentId</str>
      <str name="title">The title</str>
      <str name="description">Keywords, keyword is highlighted.</str>
   </doc>
</result>
<lst name="highlighting">
   <lst name="myDocumentId">
      <str name="title">The title contains <em>keyword</em></str>
      <str name="description"><em>Keyword</em>s, <em>keyword</em> is highlighted.</str>
   </lst>
</lst>