сконвертировать HTML -> plain text

Sad Spirit

мизантроп (Старожил PHPClub)
Команда форума
сконвертировать HTML -> plain text

Предыстория: есть сайт, на сайте есть подписка на рассылку. Время от времени контент-менеджер садится и пишет гениальный текст, который потом затаив дыхание читают бессчётные тыщи подписчиков.

Проблема: текст пишется в wysiwyg редакторе, а среди подписчиков наверняка найдутся извращенцы, которые захотят его читать в plain text. Посему надо завести ещё обычную textarea для plain text версии и как-то конвертировать в неё содержимое редактора.

Решение с тупым выкусыванием тегов не очень нравится, т.к. хотелось бы всё же сохранить подобие разметки. Видно три решения:
  1. Модная технология AJAX: HTML отправляется на сервер, там делается что-то типа
    Код:
    lynx -dump
    результат отправляется обратно. Есть ли, кстати, какие-нибудь специализированные утилиты для такой обработки --- не очень нравится, что lynx делает с ссылками?
  2. В браузерах есть возможность сохранять страницу как текст. Возможно ли дёргать эту функциональность (не сохранять, это понятно нельзя, а конвертировать) из Javascript'а?
  3. Возможно есть какие-нибудь чисто Javascript'овые библиотеки для конвертации?
 

fixxxer

К.О.
Партнер клуба
а насколько сложный хтмл? если таблиц нет, то в принципе регулярками несложно минимально оформить...

links посимпатичнее делает :) правда, ссылки, кажется, вообще никак не проставляет.
 

Sad Spirit

мизантроп (Старожил PHPClub)
Команда форума
Автор оригинала: fixxxer
а насколько сложный хтмл? если таблиц нет, то в принципе регулярками несложно минимально оформить...
Ну возможно, но мне кажеца задача не настолько уникальная, чтобы никто этого раньше не делал... Где бы найти результаты их работы? :]
 
Сверху