ПашаV
Новичок
Подскажите, может кто знает, мне нужно распарсить PDF файл таким образом чтобы на выходе получился HTML файл (чтобы форматирование и всё было внешне практически как в PDF), т.е. с сохранением разметки, шрифтов, цветов, таблицы, изображения теги.. + все изображения тоже выкачать из PDF.
Например на входе имеем: article.pdf
На выходе zip-архив, с содержимимым:
article.zip
./index.html
./images/
./images/image1.jpg
./images/image2.jpg
..
и т.д. если картинок много.
Т.е. распаковав такой архив, и открыв файл index.html я бы внешне увидел бы тот же самый контент что и в PDF файле и картинки чтобы все отображались.
Реально ли такое сделать? и если вы знаете подобные реализации или решения, буду признателен.
Либо подскажите как такое сделать самому, с чего начать, итерации и на ваш взгляд какой самый оптимальный способ решения данной задачи?
Заранее спасибо!
Например на входе имеем: article.pdf
На выходе zip-архив, с содержимимым:
article.zip
./index.html
./images/
./images/image1.jpg
./images/image2.jpg
..
и т.д. если картинок много.
Т.е. распаковав такой архив, и открыв файл index.html я бы внешне увидел бы тот же самый контент что и в PDF файле и картинки чтобы все отображались.
Реально ли такое сделать? и если вы знаете подобные реализации или решения, буду признателен.
Либо подскажите как такое сделать самому, с чего начать, итерации и на ваш взгляд какой самый оптимальный способ решения данной задачи?
Заранее спасибо!