Как таблицы из пэдээфок переносить в эксельку? Большинство таблиц даны не с границами, а просто с интервалами. Вот пример: http://www.gazprom-neft.ru/investor/financials/ тут самый верхний отчёт. Там таблицы не стандартные :) Вот и мучаюсь я перебиваю по кусочкам их в эксель, теряю кучу времени.
Спасите !
Драйфф, я тебе как специалист специалисту отвечу, что PDF - это всего-лишь формат представления документа. Со всеми вытекающими.
По сему, если сам документ представляет собой картинку (а многие конверты именно так в PDF и переводят через виртуальные принтеры), то чтобы с ним работать, эту картинку придётся чем-то распознать. Adobe Acrobat в своём составе имеет даже OCR модуль для таких целей.
А в общем же случае PDF представляет собой точно такую же солянку из различных элементов текста (внедрённые шрифты, картинки, символы и т.д.). И с каждым элементом можно совершенно свободно работать.
Насчёт pdf2xls - это вряд ли. Но любой распознанный документ можно с небольшими ограничениями по вёрстке перевести в формат MS Word. А уже оттуда больших проблем с переносам таблицы в MS Excel проблем не будет.
Тогда, ув. специалисты, можете подробно объянсить возможные переносы таблиц из файла, на который я дал ссылку в первом посте ( http://www.gazprom-neft.ru/investor/financials/ "Анализ руководством компании финансового состояния и результатов деятельности за 3 и 9 месяцев 2008 года (на русском языке)
" там любую табличку для примера)?
Each PDF file encapsulates a complete description of a fixed-layout 2-D document (and, with Acrobat 3-D, embedded 3-D documents) that includes the text, fonts, images, and 2-D vector graphics which compose the documents. © Wikipedia
MS Word - не родной редактор и не родной формат для PDF. И я не встречал ни одного нормального конвертера, который массого даёт хорошие результаты.
А вот с использованием родной проги (Adobe Acrobat) я практически не имел проблем в том, чтобы отредактировать в PDF какие-нибудь элементы (блоки текста или картинку заменить) - проблем не испытывал.
К тому же я программист, и я знаю изнутри, как устроен PDF. А так же знаю то, что у нас в России каждый первый документ PDF сделан через какой-нибудь фильтр-принтер, и по сути представляет собой документ с одни элементом - картинка. И их все приходится OCR'ить.
Спасибо огромное, Драйв! Ты меня спас!
А Гриди только языком чесал. Драйв хароший, а Гриди плахой!
* умирает от зависти *
Тайлер, я Тебе как не специалист и дворник скажу.
Уже где-то 9 месяцев постоянно работою с разного рода данными и отчетами, поэтому у меня наработанная методика (:
1) Поищи эти данные, в других форматах :) Очень часто их можно найти.
2) Если не нешел, выдели данные методом в стиле CTRL+A, вставь в блокнот, импортони в эксель данные из блокнота и как делиметр установи пробел :) Если погрешность маленькая, то три колонки можно и ручками заполнить.
3) Если понятно, что первые два шаманства не дадут результата, то тогда уже нужно идти по схеме Драйв-Гриди.
Конверты всякие, сканы страниц и т.д.
А вот между прочим никто не предупредил что конвертер 2 страницы будет 30 минут в ворд зафигачивать 5 роликов на ютуб быстрее конвертнуть окажется...
Драйв, я не читала всю тему. Спрошу то, что мне нужно: есть способ перенести файл из пдф в ворд, чтобы можно было редактировать? А то у нас часто партнеры в пдф договора делают, заполнять неудобно)
Drive Alienn
да я уж разобрался )) старая версия была видимо баганутая съела 100% одно ядра и не тронула второе, и еще 1.8 гб памяти обновил и сделалось за секунды ))
мне надо так, чтобы этот вордовский файл потом можно было редактировать как обычный документ ворд. Осталось тока найти того, кто мне Адоб взломает)
Ты же сам написал в ответе Гриди, что если конвертировать через Солид, то на такой файл можно будет тока любоваться. А любоваться я и в ПДФ могу!
Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)