Ak85
Guest
Парсинг бааальшого xml'ника
dmoz.org думаю все знают. Так вот беру и скачиваю content.rdf.u8.gz (296M) (Небольшой пример XML'ника )формат RDF.
Задача: на сайте начиная с определенного узла этого дерева выводится ссылки и категории как в каталоге. Но не в этом проблема - как максимально экономично для ресурсов сервера (Linux или FreeBSD + PHP4) пропарсить этот файл для поиска и анализа данных. Можно использовать для парсинга регулярки, но думаю есть способы оптимальнее, но я их ненашел(Святые RTFM и Поиск не помогли). Причем главное - не использовать БД(не надо ругаться и говорить нехорошие слова - база и так загружена другими процессами до отказа).
dmoz.org думаю все знают. Так вот беру и скачиваю content.rdf.u8.gz (296M) (Небольшой пример XML'ника )формат RDF.
Задача: на сайте начиная с определенного узла этого дерева выводится ссылки и категории как в каталоге. Но не в этом проблема - как максимально экономично для ресурсов сервера (Linux или FreeBSD + PHP4) пропарсить этот файл для поиска и анализа данных. Можно использовать для парсинга регулярки, но думаю есть способы оптимальнее, но я их ненашел(Святые RTFM и Поиск не помогли). Причем главное - не использовать БД(не надо ругаться и говорить нехорошие слова - база и так загружена другими процессами до отказа).