PHP как платформа для анализа меняющихся данных из HTML

Zo

Новичок
PHP как платформа для анализа меняющихся данных из HTML

Господа!
Поставлена задача анализа HTML-файлов, содержащих отчеты с некоторыми данными. Т.е. необходимо данные, содержащиеся в HTML, поместить в БД для анализа!
Проблема состоит в том, что форматы файлов меняются! Т.е. необходимо что-то настраиваемое! :(
Платформа PHP 4. и улучшения в сторону 5-ки не появятся!

Мой способ:
А) XML
1. Преобразовать каким-то образом исходный файл в XML
2. XML через XSLT-листы слить в XML собственного (общего) формата
3. XML общего формата в БД

Как предлагаете решить задачу и целесообразно ли выполнять это предложенным методом?
Как по вашему лучше всего достичь универсальности?

Читал
тут , что есть libxml и там есть какие-то возможности по перегону из html в XML, но это я так понял реализовано возможностями DOM,а не DOM XML, который в php4.
Видели ли, что-нибудь еще вкусненькое для работы с XML для 4-ки? Или вообще ЛУЧШЕ ЭТО ДЕЛО на других платформах реализовывать?
 
Сверху