RTF - парсер

Shadow_1512

Новичок
RTF - парсер

Кто-нибудь подскажет хороший RTF-парсер, с которым удобно работать?
Откопал один на phpclasses.org, но он мягко говоря неважнецкий.
Заранее спасибо.
 

Profic

just Profic (PHP5 BetaTeam)
По большому счету могу сказать - забудь. В смысле забудь про таковой на PHP. У меня есть парсер, написанный под PHP5, при этом реализующий далеко не полную спецификацию rtf. Но, нет даже так, НО этот парсер простой документ (несколько десятков килобайт) парсит начиная от 3 секунд. Все из-за дубовости спецификации rtf.

Кстати, для чего парсер-то нужен. Т.е. что будет в конце.

В зависимости от потребностей могу посоветовать либо использовать Word через COM, либо искать реализации на C/Java.
Кстати про Java - есть преобразователь из rtf в xml:fo, но он стоит денег.
 

Shadow_1512

Новичок
Автор оригинала: Profic
По большому счету могу сказать - забудь. В смысле забудь про таковой на PHP. У меня есть парсер, написанный под PHP5, при этом реализующий далеко не полную спецификацию rtf. Но, нет даже так, НО этот парсер простой документ (несколько десятков килобайт) парсит начиная от 3 секунд. Все из-за дубовости спецификации rtf.

Кстати, для чего парсер-то нужен. Т.е. что будет в конце.

В зависимости от потребностей могу посоветовать либо использовать Word через COM, либо искать реализации на C/Java.
Кстати про Java - есть преобразователь из rtf в xml:fo, но он стоит денег.
Да я в общем видел, что один примерный парсер работал долго. Нужно это для того, что у клиента есть куча каталогов , примерно этак страниц 2000. И он хочет, чтобы все это было на сайте точь в точь как в каталоге, с той же версткой. Ну таблицы, рисунки отдельно, а вот всякие выделения, выравнивания. А верстать вручную или даже полуавтоматом 2000 страниц мне что-то не улыбается....
 

Long

Новичок
Shadow_1512 тогда через СОМ проще реализовать. открыть в ворде и через СОМ его. либо сохранить из ворда как хтмл. а потом можно и чистильщик кода напустить, если уж хочется код причесать..
 

Profic

just Profic (PHP5 BetaTeam)
Shadow_1512
В данном случае проще всего сконвертить все в ворде в html (который filtered), и потом просто еще немного подчистить и заюзать.
 
Сверху