Можно ли таблицу с текстом из pdf перегнать в Excel?

golos81

Новичок
Можно ли таблицу с текстом из pdf перегнать в Excel?

Есть таблица в файле формата pdf. Если в акробате делаю поиск по фразам, то он их находит, переводит курсор в то место и выделяет фразу. Значит вроде как там все в тексте хранится. Можно ли как-нибудь таблицу из psd экспортировать в Excel или другой табличный файл. Пробовал сохранять в txt, но тогда таблица рушится, остается куча текста. Не хочется перебивать руками всю таблицу в Excel. Посоветуйте, как быть?
 

Solid

Drosera anglica
kruglov
Зачем OCR? Он же сказал, что текст идёт текстом, а не картинкой...
 

Solid

Drosera anglica
kruglov
Тоже, потому что с этим сталкивался, когда-то...
Он не понимает, как можно увидеть таблицу, после экстракции из pdf в текст...
К примеру у него вывод примерно следующий:
Column heading 1 Column heading 2 Column heading 3
Row heading 1 Cell 2 Cell 3
Row heading A Cell B Cell C

Как ещё можно выбрать все данные из этой "таблицы"? Если через PHP, то только через parsing данных посредству выше обозначенных функций.
 

Vasiley

Новичок
Насчет Excel не уверен, но был свидетелем парсинга PDF каталога весом 1Гб в html
 
Сверху