Использованиие класса для конвертации html

Статус
В этой теме нельзя размещать новые ответы.

zIP

Новичок
Использованиие класса для конвертации html

Нашел класс для конвертации html в txt

http://php-html.sourceforge.net/html2text.php

Вот что пишет автор парсера
This example is part of the project titled HTML Parser for PHP-4. It's a class named Html2Text which converts HTML to ASCII text, while attempting to preserve page formatting.

Этот пример - часть проекта названный HTML Parser для PHP-4 <index.php>. Это - класс по имени Html2Text, который конвертирует(преобразовывает) HTML к тексту ASCII, при попытке сохранить форматирование страницы.
Вот пример его использования(авторский)
PHP:
<?
  include ("html2text.inc");

  $htmlText = "... HTML text here ...";
  $asciiText = new Html2Text ($htmlText, 15); // 15 columns maximum
  $text = $htmlToText->convert();
  echo "Converted to: " . $text;

?>
Все сделал как рекомендовано
А при запуске пишет:

Fatal error: Call to a member function convert() on a non-object in F:\server\INFO\BIBLIO\Convert\convert2.php on line 9
Поставил сообщение об ошибках на 8.
Стал выдовать следующее:

Notice: Undefined variable: htmlToText in F:\server\INFO\BIBLIO\Convert\convert2.php on line 9
В общем ничего не понимаю. Бред какой-то(конечно на мой взгляд
 

zIP

Новичок
Я не понимаю значение этой ошибки, я не программист.
И соответственно я не могу понять пути ее исправления

Это относиться к Fatal error:


Notice: для кучи, его можно не принимать к значению.
 

sage

Новичок
скорее всего, на http://php-html.sourceforge.net/html2text.php опечатка. попробуйте
PHP:
$text = $asciiText->convert();
 

McSimm

Новичок
авторский пример содержит ошибку.
объект инициализируется как $asciiText = new ...
а обращение к нему идет $htmlToText->convert();

замените имя переменной $asciiText на $htmlToText = new ...
 

zIP

Новичок
Присвоил значение начального текста
PHP:
<br>fgfdgfdgd<br> efdsf dfdsgfdf fdgfdggfd<br><p>ghjghjghjjhggf</p>
Выдал следующее:
Notice: Undefined property: Html2Text::$iInText in F:\server\INFO\BIBLIO\Convert\html2text.inc on line 124
Converted to: fgfdgfdgd efdsf dfdsgfdf fdgfdggfd ghjghjghjjhggf
По идеи должен быть перенос по строкам, а его нет. Да и предупреждение не совсем понятное.
 

Фанат

oncle terrible
Команда форума
По идеи должен быть перенос по строкам, а его нет. Да и предупреждение не совсем понятное.
ты хорошо подумал?
ты уверен, что переносов нет?
подумай ещё
 

zIP

Новичок
Автор оригинала: Фанат
ты хорошо подумал?
ты уверен, что переносов нет?
подумай ещё
Я не уверен, что понимаю правильно значение "переносов", наверное правильней было бы сказать новых строк?

По крайней мере в браузере это выглядит так
fgfdgfdgd
efdsf dfdsgfdf fdgfdggfd

ghjghjghjjhggf
 

Фанат

oncle terrible
Команда форума
это, как я понимаю, пример до конвертации?
до того, как ты убрал теги?
а потом, плсе того, как ты убрал, все переносы строк пропали?

скажи, а ты уверен в том, что тебе надо переводить из Html в txt?
 

zIP

Новичок
Да, это до того как.

А переводить надо. У меня довольна большая библиотека в локальной сети. Около 30 000 отсортированных и проиндексированных файлов.

Люди просят сделать возможным скачивание книг в формате txt. Пользователей довольно много, и проблема актуально.
 

Фанат

oncle terrible
Команда форума
Гравицапа
никто не говорит, что работает незамечательно.
просто некоторые не знают, что такое html и чем оно отличается от txt
 

zIP

Новичок
Так у меня их почти 30 000 сортированных в формате html.

Плюс еще не сортированной в 3 раза больше.

И в данный момент библиотека работает с книгами в html формате. И переделывать все в txt нет смысла, для этого надо полностью менять движок. Алгоритм нужен другой.

Если интересна статистика запросов книг в различных форматах

http://www.fictionbook.ru/ru/stats/

Тут все наглядно.
 

Фанат

oncle terrible
Команда форума
нет.
статистика неинтересна.

мне интересно только, чтобы ты сделал ТО, ЧТО СОБИРАЛСЯ.
тебе надо скачать книгу в формате тхт? СКАЧАЙ!
запиши туда, где ты её читать собрался.
почитай.
после этого задавай вопросы.
понятно?

-~{}~ 28.03.06 13:53:

сейчас ты смотришь свою книгу в браузере.
который предназначен для просмотра HTML
а смотришь ты в нём TXT.
понятно?
 

zIP

Новичок
Автор оригинала: Фанат
сейчас ты смотришь свою книгу в браузере.
который предназначен для просмотра HTML
а смотришь ты в нём TXT.
понятно?
Статья "Основы HTML"

Web-страничка – это обычный текстовый файл в соответствующей кодировке. В нем описывается вся страничка с помощью языка гипертекстовой разметки – HTML (HyperText Markup Language). Когда вы в своем браузере (Internet Explorer / Nestcape Navigator) загружаете web-страничку, то браузер выполняет команды, записанные на языке HTML, и, подчиняясь им, выводит на экран страничку....

Для того, чтобы текстовый файл превратился в HTML-файл, поменять его расширение с ".txt" на ".html" недостаточно. Надо соблюсти "правило первой строки".
 

Фанат

oncle terrible
Команда форума
вообще-то, я не для того тебе писал, чтобы ты вступал со мной в дискуссии =)
 

zIP

Новичок
Я хочу понять. Я знаю, что в обычном браузере можно просмотреть и текстовой файл.

Что html можно сохранить средствами браузера как текстовой файл.

Я хочу понять и решить как это реализовать. Чтобы пользователь не затруднялся сохранением средствами браузера.

-~{}~ 28.03.06 14:10:

Все напоминания не помогают. Я устал повторять про меню "файл"
 
Статус
В этой теме нельзя размещать новые ответы.
Сверху