builder
Касаемо обработки больших XML-данных более всего подходит модель SAX, как правильно заметил тов.
chameleon.
Теперь к обработке.
Сейчас распространены как минимум два подхода к обработке XML-данных (может больше, я не в курсе). Это SAX-подход и DOM-подход.
Первый пропускает через себя весь документ, последовательно обрабатывая кажды тэг, если говорить совсем просто. Суть подхода - документ читается кусками.
Второй загружат весь документ в память в виде DOM-объекта.
Непринципиально, каким языком ты будешь обрабатывать документ (PHP, Perl, C++ etc.). Главное, чтоб этот язык имел API к нижеследующим библиотекам.
Теперь о библиотеках.
1) expat (
http://expat.sourceforge.net/) - реализует SAX-подход.
2) libxml (xmlsoft.org) - реализует оба подхода.
Теперь о PHP.
В рhр4 однозначно использовать библиотеку expat и php-модуль XML
В php5 с SAX-парсингом легко справляются XMLReader и SimpleXML (несмотря на объектную ориентированность модуля).
+ статейка:
Processing Large XML Documents with PHP 5
http://blog.bitflux.ch/archive/2004/05/10/processing_large_xml_documents_with_php.html
-~{}~ 01.07.05 20:59:
Поставить эти экстеншены легко.
В php4/5 модуль XML ставится по-умолчанию
