Как читать pdf?

varan

Б̈́̈̽ͮͣ̈Л̩̲̮̻̤̹͓ДͦЖ̯̙̭̥̑͆А͇̠̱͓͇̾ͨД͙͈̰̳͈͛ͅ
Как читать pdf?

Как читать pdf-файлы?
Возможно ли это делать средствами php?
 

varan

Б̈́̈̽ͮͣ̈Л̩̲̮̻̤̹͓ДͦЖ̯̙̭̥̑͆А͇̠̱͓͇̾ͨД͙͈̰̳͈͛ͅ
И что?
Я там был. Там только про создание pdf-документов.
В комментах есть какие-то функции для чтения, но они не работают ни фига.
 

440hz

php.ru
прочитать файл не проблема. 8) fopen(), fread(), fclose()
проблема, наверное в том, что ты хочешь из него вытащить?
 

kvf77

Red Devil
varan

я же тебе сказал - берешь спецификацию на формат и вперед. Она в свободном доступе. Очень много всяких подводных камней в этом деле - так что изучай и пробуй.
 

varan

Б̈́̈̽ͮͣ̈Л̩̲̮̻̤̹͓ДͦЖ̯̙̭̥̑͆А͇̠̱͓͇̾ͨД͙͈̰̳͈͛ͅ
Может есть ссылка на какой-нибудь вводный курс?
Сейчас скачал pdf reference, так там 1256 страниц английского текста. Это ж можно целый год на это убить. А мне только текст нужно вычленить, да и то не обязательно весь.
 

neko

tеam neko
скачать xpdf и соббрать оттуда тулзы которые переводят pdf в текст
делают они это довольно таки скверно, но больше ничего на ум не приходит

используй гугл
 

yantar

Новичок
Здравствуйте, тоже такая проблема, надо распарсить pdf документ, хотя бы текст оттуда вытянуть.
 

yantar

Новичок
читал предыдущие посты, поиском пользовался - ничего толкового не нашел.
 

Гравицапа

elbirret elcno
yantar
Вам подсказали пути решения проблемы.
Если вы не умеете полученные знания использовать, то ой...
 

yantar

Новичок
Нашел утилиту pdftotext, она только читает текст из pdf документа, а мне еще надо заменять в этом же pdf документе текст (пример, есть на русском языке pdf документ, переводчик вбивает в текстовые поля перевод текста, создается другой pdf документ - только уже на другом языке)
Сначала делали так: переводчики вбивали текст в html редакторе (FCKEditor), потом используя библиотеку html2fpdf закидывали в pdf, но шефу нужна точная копия того, что браузер показывает, с точностью до миллиметров. Решили использовать другой вариант: в готовом pdf документе менять текст.
 
Сверху