Полная версия этой страницы:
Перенос таблиц из pdf в Excel
Как таблицы из пэдээфок переносить в эксельку? Большинство таблиц даны не с границами, а просто с интервалами. Вот пример:
http://www.gazprom-neft.ru/investor/financials/ тут самый верхний отчёт. Там таблицы не стандартные :) Вот и мучаюсь я перебиваю по кусочкам их в эксель, теряю кучу времени.
Спасите !
Аманэ Миса
3.3.2009, 15:54
Драйфф, я тебе как специалист специалисту отвечу, что PDF - это всего-лишь формат представления документа. Со всеми вытекающими.
По сему, если сам документ представляет собой картинку (а многие конверты именно так в PDF и переводят через виртуальные принтеры), то чтобы с ним работать, эту картинку придётся чем-то распознать. Adobe Acrobat в своём составе имеет даже OCR модуль для таких целей.
А в общем же случае PDF представляет собой точно такую же солянку из различных элементов текста (внедрённые шрифты, картинки, символы и т.д.). И с каждым элементом можно совершенно свободно работать.
Насчёт pdf2xls - это вряд ли. Но любой распознанный документ можно с небольшими ограничениями по вёрстке перевести в формат MS Word. А уже оттуда больших проблем с переносам таблицы в MS Excel проблем не будет.
Голландец
3.3.2009, 22:50
Тогда, ув. специалисты, можете подробно объянсить возможные переносы таблиц из файла, на который я дал ссылку в первом посте (
http://www.gazprom-neft.ru/investor/financials/ "Анализ руководством компании финансового состояния и результатов деятельности за 3 и 9 месяцев 2008 года (на русском языке)
" там любую табличку для примера)?
Аманэ Миса
4.3.2009, 1:28
Each PDF file encapsulates a complete description of a fixed-layout 2-D document (and, with Acrobat 3-D, embedded 3-D documents) that includes the text, fonts, images, and 2-D vector graphics which compose the documents. © Wikipedia
MS Word - не родной редактор и не родной формат для PDF. И я не встречал ни одного нормального конвертера, который массого даёт хорошие результаты.
А вот с использованием родной проги (Adobe Acrobat) я практически не имел проблем в том, чтобы отредактировать в PDF какие-нибудь элементы (блоки текста или картинку заменить) - проблем не испытывал.
К тому же я программист, и я знаю изнутри, как устроен PDF. А так же знаю то, что у нас в России каждый первый документ PDF сделан через какой-нибудь фильтр-принтер, и по сути представляет собой документ с одни элементом - картинка. И их все приходится OCR'ить.
Спасибо огромное, Драйв! Ты меня спас!
А Гриди только языком чесал. Драйв хароший, а Гриди плахой!
Аманэ Миса
4.3.2009, 18:52
* умирает от зависти *
Тайлер, я Тебе как не специалист и дворник скажу.
Уже где-то 9 месяцев постоянно работою с разного рода данными и отчетами, поэтому у меня наработанная методика (:
1) Поищи эти данные, в других форматах :) Очень часто их можно найти.
2) Если не нешел, выдели данные методом в стиле CTRL+A, вставь в блокнот, импортони в эксель данные из блокнота и как делиметр установи пробел :) Если погрешность маленькая, то три колонки можно и ручками заполнить.
3) Если понятно, что первые два шаманства не дадут результата, то тогда уже нужно идти по схеме Драйв-Гриди.
Конверты всякие, сканы страниц и т.д.
Parfumer
19.1.2010, 17:01
А вот между прочим никто не предупредил что конвертер 2 страницы будет 30 минут в ворд зафигачивать 5 роликов на ютуб быстрее конвертнуть окажется...
Olyssiya
19.1.2010, 18:17
Драйв, я не читала всю тему. Спрошу то, что мне нужно: есть способ перенести файл из пдф в ворд, чтобы можно было редактировать? А то у нас часто партнеры в пдф договора делают, заполнять неудобно)
Parfumer
19.1.2010, 19:41
Drive Alienn
да я уж разобрался )) старая версия была видимо баганутая съела 100% одно ядра и не тронула второе, и еще 1.8 гб памяти
обновил и сделалось за секунды ))
Цитата(Drive Alienn @ 19.1.2010, 23:06)
Дорогая Алиса. Почитай тему. Она вообще то об этом.
Почитала *грустно вздыхает* Т.е. никак((
Olyssiya
20.1.2010, 10:55
мне надо так, чтобы этот вордовский файл потом можно было редактировать как обычный документ ворд. Осталось тока найти того, кто мне Адоб взломает)
Olyssiya
20.1.2010, 12:43
Ты же сам написал в ответе Гриди, что если конвертировать через Солид, то на такой файл можно будет тока любоваться. А любоваться я и в ПДФ могу!
Для просмотра полной версии этой страницы, пожалуйста,
пройдите по ссылке.