про PDF

[ Версия для печати ]
Добавить в Telegram Добавить в Twitter Добавить в Вконтакте Добавить в Одноклассники
Страницы: (2) [1] 2   К последнему непрочитанному [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]
shrec
18.09.2019 - 11:36
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
5
Всем привет )
может кто сталкивался с такой вот проблемой.

Есть документ в PDF полученный от "партнеров"

грубо говоря в нем 10 строчек.
при распечатывании данного документа он выглядит как на экране.
если данный документ конвертировать FR из pdf в doc он будет идентичен pdf файлу.
НО
если из него попытаться скопировать 5-6-7 строку текста в ворд , то будет сюрприз - текст другой( в pdf файле его не видно).
если данный документ конвертировать Adobe Acrobat Pro в doc то появится скрытый текст и тот что виден.

Может ли кто подсказать как это сделано и как в дальнейшем избегать подобных файлов ?)
 
[^]
Yap
[x]



Продам слона

Регистрация: 10.12.04
Сообщений: 1488
 
[^]
педобелка
18.09.2019 - 11:39
2
Статус: Offline


Из бурлящего океана толпы

Регистрация: 24.09.11
Сообщений: 22252
shrec
ты б хоть скрины выложил,чтоб видеть,ап чем речь идет..
 
[^]
Элвис
18.09.2019 - 11:39
3
Статус: Offline


Ярила

Регистрация: 5.08.12
Сообщений: 5618
ну х.з. я в XLе веду деловую переписку ...
 
[^]
shrec
18.09.2019 - 11:49
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
педобелка
не могу ( там реквизиты

очень похоже как слои в фотошепе )


Это сообщение отредактировал shrec - 18.09.2019 - 11:51
 
[^]
Loaded
18.09.2019 - 11:49
6
Статус: Offline


Шлакоблокунь

Регистрация: 13.06.11
Сообщений: 3221
Мое предположение:
Если PDF был создан в Иллюстраторе, то возможно там просто 2 (или больше) текстовых слоя наложенные один поверх другого. При публикации файла просто нужный текстовый слой делается видимым а остальные отключаются.
 
[^]
Scribbler
18.09.2019 - 11:51
3
Статус: Offline


Сибирский мандалорец

Регистрация: 12.12.18
Сообщений: 70928
пдф и эксель - самые ненавистные мною форматы.
 
[^]
Beholder
18.09.2019 - 11:52
1
Статус: Offline


ТипоГраф

Регистрация: 7.11.05
Сообщений: 1000
Посмотри в свойствах, откуда этот pdf был сделан. Как уже сказали, вполне возможно, что были слои.
И да, реквизиты - не есть тайна. Все в открытом доступе.

Это сообщение отредактировал Beholder - 18.09.2019 - 11:54
 
[^]
Realist007
18.09.2019 - 11:53
1
Статус: Offline


Ярила

Регистрация: 19.07.15
Сообщений: 5538
Цитата (shrec @ 18.09.2019 - 11:49)
педобелка
не могу ( там реквизиты


ну так замулюй.
 
[^]
shrec
18.09.2019 - 11:53
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
Цитата (Loaded @ 18.09.2019 - 11:49)
Мое предположение:
Если PDF был создан в Иллюстраторе, то возможно там просто 2 (или больше) текстовых слоя наложенные один поверх другого. При публикации файла просто нужный текстовый слой делается видимым а остальные отключаются.

вроде как в маке пилили

про PDF
 
[^]
zyguli2105
18.09.2019 - 11:53
0
Статус: Offline


Ярила

Регистрация: 14.06.18
Сообщений: 3037
Сохранить как. Печатаешь
 
[^]
shrec
18.09.2019 - 11:53
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
Цитата (Realist007 @ 18.09.2019 - 11:53)
Цитата (shrec @ 18.09.2019 - 11:49)
педобелка
не могу ( там реквизиты


ну так замулюй.

так фишка в самих реквизитах
 
[^]
poqx
18.09.2019 - 11:54
4
Статус: Offline


ви-ip

Регистрация: 21.10.14
Сообщений: 736
Цитата (Элвис @ 18.09.2019 - 20:39)
ну х.з. я в XLе веду деловую переписку ...

фи , настоящие деловые люди используют paint !
 
[^]
shrec
18.09.2019 - 11:55
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
Loaded
а чем расковырять ?
 
[^]
PapaRimskiy
18.09.2019 - 11:56
3
Статус: Offline


Ярила

Регистрация: 15.04.13
Сообщений: 3398
Цитата (poqx @ 18.09.2019 - 11:54)
Цитата (Элвис @ 18.09.2019 - 20:39)
ну х.з. я в XLе веду деловую переписку ...

фи , настоящие деловые люди используют paint !

Я вообще на глиняных табличках клинописью хуярю!
 
[^]
Loaded
18.09.2019 - 11:57
0
Статус: Offline


Шлакоблокунь

Регистрация: 13.06.11
Сообщений: 3221
Цитата (shrec @ 18.09.2019 - 10:53)
Цитата (Loaded @ 18.09.2019 - 11:49)
Мое предположение:
Если PDF был создан в Иллюстраторе, то возможно там просто 2 (или больше) текстовых слоя наложенные один поверх другого. При публикации файла просто нужный текстовый слой делается видимым а остальные отключаются.

вроде как в маке пилили

Это ни о чем не говорит. AI есть на маке и есть в клауде.

Цитата
Loaded
а чем расковырять ?

Понятия не имею, да и что это тебе даст? Можешь в том же AI попробовать или фотошопой.

Это сообщение отредактировал Loaded - 18.09.2019 - 12:03
 
[^]
Beholder
18.09.2019 - 11:57
0
Статус: Offline


ТипоГраф

Регистрация: 7.11.05
Сообщений: 1000
Quartz PDFContext - судя по постам в инете, сама по себе глючная рукожопная софтина. Поэтому и нахуивертить она могла при создании что угодно.

Поставь Foxit PhantomPDF - и будет тебя счастье.

Это сообщение отредактировал Beholder - 18.09.2019 - 11:58
 
[^]
shrec
18.09.2019 - 11:59
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
в Акробате в инструментах есть удалить скрытую информацию
а как ее посмотреть ?
 
[^]
716котят
18.09.2019 - 12:00
0
Статус: Offline


Толпа животных

Регистрация: 20.04.07
Сообщений: 4061
Цитата (shrec @ 18.09.2019 - 12:36)
... появится  скрытый текст и тот что виден. ...

Скрытый слой, либо текст просто белым сделали. Можешь слой удалить. Можешь разобрать ПДФ.
Цитата (shrec @ 18.09.2019 - 12:36)
Может ли кто подсказать как это сделано...

Сделано криворукими мудаками. Часто такое встречаю.
Цитата (shrec @ 18.09.2019 - 12:36)
...и как в дальнейшем избегать подобных файлов ?)

А никак, к каждому файлу подход индивидуальный.
Хотя можешь попробовать сначала на виртуальный принтер пускать

Это сообщение отредактировал 716котят - 18.09.2019 - 12:04
 
[^]
vstgod
18.09.2019 - 12:01
3
Статус: Offline


Ярила

Регистрация: 26.04.13
Сообщений: 1258
Цитата (poqx @ 18.09.2019 - 13:54)
Цитата (Элвис @ 18.09.2019 - 20:39)
ну х.з. я в XLе веду деловую переписку ...

фи , настоящие деловые люди используют paint !

Нене, настоящие - это PDF картинкой, бля...
 
[^]
shrec
18.09.2019 - 12:03
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
вроде как нашел что это "модуль touchup"
три слоя
основной текст
пустая рамка
нужный текст
- при распечатывании - тест то что виден.
при копировании основной текст
 
[^]
shrec
18.09.2019 - 12:04
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
Цитата (Loaded @ 18.09.2019 - 11:57)
Цитата (shrec @ 18.09.2019 - 10:53)
Цитата (Loaded @ 18.09.2019 - 11:49)
Мое предположение:
Если PDF был создан в Иллюстраторе, то возможно там просто 2 (или больше) текстовых слоя наложенные один поверх другого. При публикации файла просто нужный текстовый слой делается видимым а остальные отключаются.

вроде как в маке пилили

Это ни о чем не говорит. AI есть на маке и есть в клауде.

Цитата
Loaded
а чем расковырять ?

Понятия не имею, да и что это тебе даст? Можешь в том же AI попробовать или фотошопой.

фотошоп не ковыряет его ) он как fr видит только верх )
 
[^]
exoricst
18.09.2019 - 12:08
0
Статус: Offline


Ярила

Регистрация: 4.06.15
Сообщений: 7940
Цитата (shrec @ 18.09.2019 - 11:36)
Всем привет )
может кто сталкивался с такой вот проблемой.

Есть документ в PDF полученный от "партнеров"

грубо говоря в нем 10 строчек.
при распечатывании данного документа он выглядит как на экране.
если данный документ конвертировать FR из pdf в doc он будет идентичен pdf файлу.
НО
если из него попытаться скопировать 5-6-7 строку текста в ворд , то будет сюрприз - текст другой( в pdf файле его не видно).
если данный документ конвертировать Adobe Acrobat Pro в doc то появится скрытый текст и тот что виден.

Может ли кто подсказать как это сделано и как в дальнейшем избегать подобных файлов ?)

В пдф два файла, одна картинка другая уже распознанный текст. Текст может распознаться коряво.
Думаю надо загнать в программу распознавания текстов, если надо.
 
[^]
shrec
18.09.2019 - 12:16
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
Цитата (exoricst @ 18.09.2019 - 12:08)
Цитата (shrec @ 18.09.2019 - 11:36)
Всем привет )
может кто  сталкивался с такой вот проблемой.

Есть документ в PDF полученный от "партнеров"

грубо говоря в нем 10 строчек.
при распечатывании данного документа он выглядит как на экране.
если данный документ конвертировать FR из pdf в doc он будет идентичен pdf файлу.
НО
если из него попытаться скопировать 5-6-7 строку  текста в ворд , то будет сюрприз - текст другой( в pdf файле его не видно).
если данный документ конвертировать Adobe Acrobat Pro  в doc то появится  скрытый текст и тот что виден.

Может ли кто подсказать как это сделано и как в дальнейшем избегать подобных файлов ?)

В пдф два файла, одна картинка другая уже распознанный текст. Текст может распознаться коряво.
Думаю надо загнать в программу распознавания текстов, если надо.

распознает то что видно проверенно на FR 11 и ABBYY PDF Transformer 3.0

сам акробат при перегоке в вордовский файл еще и скрытый текст вставляет
 
[^]
vonBierbah
18.09.2019 - 12:16
0
Статус: Offline


Ярила

Регистрация: 21.04.14
Сообщений: 2904
Цитата (Loaded @ 18.09.2019 - 11:49)
Мое предположение:
Если PDF был создан в Иллюстраторе, то возможно там просто 2 (или больше) текстовых слоя наложенные один поверх другого. При публикации файла просто нужный текстовый слой делается видимым а остальные отключаются.

А кроме слоёв ещё картинок, суки, понапихают, мультимедии всякой и файлов вложениями. Как я этот грёбаный ПДФ ненавижу. moderator.gif А вообще редакторов спецом под него напилили кучу навороченных и за бабло людям впаривают. Мне так Okular нравится. Практически всё могёт.
 
[^]
shrec
18.09.2019 - 13:19
0
Статус: Online


¯\_(ツ)_/¯

Регистрация: 8.04.14
Сообщений: 1429
Собственно решил вопрос.

на текст сверху вставлена картинка.

при печати она распечатывается
если скопировать текст то будет в буфере будет текст под картинкой.
 
[^]
Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 2218
0 Пользователей:
Страницы: (2) [1] 2  [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]


 
 



Активные темы






Наверх