Парсинг бааальшого xml'ника

Ak85 · 19 Май 2005

Парсинг бааальшого xml'ника

dmoz.org думаю все знают. Так вот беру и скачиваю content.rdf.u8.gz (296M) (Небольшой пример XML'ника )формат RDF.
Задача: на сайте начиная с определенного узла этого дерева выводится ссылки и категории как в каталоге. Но не в этом проблема - как максимально экономично для ресурсов сервера (Linux или FreeBSD + PHP4) пропарсить этот файл для поиска и анализа данных. Можно использовать для парсинга регулярки, но думаю есть способы оптимальнее, но я их ненашел(Святые RTFM и Поиск не помогли). Причем главное - не использовать БД(не надо ругаться и говорить нехорошие слова - база и так загружена другими процессами до отказа).

Fiva · 19 Май 2005

парси обычным саксовым парсером(xml_func), и паралельно с пропарсиванием ищи то что тебе нужно

Фанат · 19 Май 2005

Парсинг бааальшого xml'ника
главное - не использовать БД- база и так загружена другими процессами до отказа

гениальная фраза.
её надо на граните высечь, золотыми буквами.

а гранит поставить как памятник всем идиотам этой планеты.

Ak85 · 19 Май 2005

2Fiva:
Мерси, попробуем..

2Фанат:
Зря ржешь. Обстановки ведь незнаешь... А памятник жду

Фанат · 19 Май 2005

я не ржу, я плачу.

Alexandre · 19 Май 2005

можно парсить и обыкновенным поиском подстроки.
главное, что нет вложенных одноименных тег

чем не вариант?

Ak85 · 19 Май 2005

Все мерси. Разрешил. Читаю построчно, причем не разрываю основные блоки, потом вручную парсю. Кстати, я ошибся файл весит не 300мб а 2гб, поэтому стандартные парсеры нельзя использовать - как я понял они всю структуру сразу в память кидают...

Тема закрыта

Fiva · 19 Май 2005

саксовый парсер афаик ничего в память не кидает, я парсил 600мб файло - без проблем.

ViJu · 1 Июн 2005

Есть еще xmlreader (они это называют курсорной моделью), создан специально для такой работы

http://php5.bitflux.org/xmlonspeed/slide_13.php

slach · 1 Июн 2005

ViJu ему для php4 !

aK85 - изучи внимательно http://php.net/manual/ref.xml.php
посмотри примеры

никто ничего в память не кидает

Парсинг бааальшого xml'ника

Ak85

Guest

Fiva

Держу ZMH

Фанат

oncle terrible

Ak85

Guest

Фанат

oncle terrible

Alexandre

PHPПенсионер

Ak85

Guest

Fiva

Держу ZMH

ViJu

Новичок

slach

Новичок