holem
Новичок
кодировка данных pdf-файла
Доброго времени суток.
Облазил кучу сайтов, но так и не могу понять как перекодировать данные из pdf-файлов в win1251.
Нашел вот что:
Может кто уже занимался разбором pdf-файла? Подскажите, пожалуйста, в какую сторону смотреть.
Заранее большое спасибо.
Доброго времени суток.
Облазил кучу сайтов, но так и не могу понять как перекодировать данные из pdf-файлов в win1251.
Нашел вот что:
Как определить на основе какого файла строится pdf-файл сделать можно (поиском непечатаемых символов в даннных), а вот как перекодировать с 7-ми или 8-ми битового ASCII в win1251?PDF-файл строится на основе либо 7-битового ASCII-файла, либо на базе бинарного файла. Если это ASCII-файл, в нем используются только печатные символы 7-битового ASCII-кода, пробел, табуляция, возврат каретки и перевод строки. В случае бинарного файла могут быть использованы все символы 8-битового кода. Считается, что ASCII-код - наиболее удобный для переноса вид кодировки.
Может кто уже занимался разбором pdf-файла? Подскажите, пожалуйста, в какую сторону смотреть.
Заранее большое спасибо.