2022/05/25 16:57:07

PDF (Portable Document Format)

Portable Document Format (PDF) - формат файлов для отображения текстовой информации и медиаданных на большинстве вычислительных платформ.

Содержание

PDF (Portable Document Format) — межплатформенный формат электронных документов. Разработан компанией Adobe Systems с использованием языка PostScript[1].

Одним из способов создания PDF-документов является виртуальный принтер - документ, как таковой, готовится в своей специализированной программе — графическом приложении или текстовом редакторе, САПР и т.п., затем экспортируется в формат PDF для распространения в электронном виде, передачи в типографию и т.д.

Для просмотра файлов в формате PDF существует множество программ и официальная программа Adobe Reader. Значительное количество современного профессионального печатного оборудования имеет аппаратную поддержку формата PDF, это позволяет печатать документы без использования какого-либо программного обеспечения.


История

Файловый формат PDF создан компанией Adobe в 1992 году. В течение следующих 20 лет формат переносимых документов (PDF) стал открытым стандартом для обмена электронными документами, его признала международная организация по стандартизации (ISO). Российский рынок HR-tech: оценки, перспективы, крупнейшие поставщики. Обзор TAdviser 100.1 т

В первое время своего существования он не был популярен:

  • ПО от Adobe для чтения и создания PDF было платным;
  • отсутствовала поддержка внешних ссылок;
  • PDF-документы были громоздкими по сравнению с обычным текстом;
  • вывод на экран PDF-документа на машинах с невысокой производительностью требовал от пользователей терпения.

Существовало несколько конкурирующих форматов: Envoy, Common Ground Digital Paper, Farallon Replica и даже PostScript являлся конкурентом.


Функциональные возможности

PDF-файл часто представляется как комбинация текста с растровой и векторной графикой, реже — текста с формами, сценариями на языке Javascript, 3D-графикой и другими типами элементов. Объём двух одинаково выглядящих на экране PDF-документов может отличаться. Это зависит от:

  • внедрения или связывания шрифтов и мультимедиа;
  • разрешения растровых изображений;
  • использования встроенного механизма сжатия всего документа;
  • используемых алгоритмов сжатия растровых изображений.

Для создания документа минимального объёма необходимо использовать векторную графику и «безопасные» шрифты, коих имеется 14, в их составе:

  • Times (v3) (обычный, курсив, полужирный и полужирный курсив)
  • Courier (обычный, наклонный, полужирный и полужирный наклонный)
  • Helvetica (v3) (обычный, наклонный, полужирный и полужирный наклонный)
  • Symbol
  • Zapf Dingbats

Эти шрифты можно использовать без внедрения в документ, поскольку все программы должны корректно отображать их на экранах. Любые другие шрифты, не внедренные в документ и отсутствующие в системе, будут заменяться одним из имеющихся, что может стать причиной увеличения или уменьшения числа страниц, количества символов в строке, межстрочного интервала и других ошибок отображения, связанных с метрикой шрифта.

Для редактирования файлов этого формата имеется некоторое количество программных продуктов.

Документы, формы, графика и веб-страницы, преобразованные в формат PDF не отличаются от напечатанных, но, в отличие от бумажных документов, файлы PDF могут содержать ссылки и элементы интерактивного интерфейса, активируемые с помощью "мыши", поля форм, встроенные видео- и аудиоданные, логические схемы, помогающие в автоматизации типовых бизнес-процессов. Содержимое файла в формате PDF может прочесть любой пользователь, используя бесплатное ПО Adobe Reader или приложения Adobe Reader для мобильных устройств.

Формат PDF позволяет внедрять необходимые шрифты, изменяющие текстовое оформление, векторные и растровые изображения, формы и мультимедиа-вставки. Поддерживаются цветовые профили RGB, CMYK, Grayscale, Lab, Duotone, Bitmap, несколько типов сжатия растровой информации. Имеются собственные технические форматы для полиграфии: PDF/X-1, PDF/X-3. Механизм защиты представлен возможностями электронной подписи. В формате PDF распространяется большое количество сопутствующей документации.


Стандарт документа PDF

1 июля 2008 года PDF стал открытым стандартом ISO 32000.


Преимущества

  • Доверие. Во всем мире формат PDF используется в качестве стандарта, обеспечивающего значительный уровень безопасности документооборота. Файлы этого формата:
    • можно защищать паролем,
    • можно помешать посторонним получить доступ к документам PDF,
    • помешать копировать их, изменять или печатать.
    • возможно удаление из документов PDF конфиденциальной информации.

  • Поддержка разных платформ. Взаимодействие с документами PDF возможно практически на любой платформе, включая Windows, ОС Mac и мобильные платформы - Android и iOS для iPhone и iPad.

  • Сохранение целостности файлов. Документы формата PDF выглядят так же, как исходные файлы, сохраняют всю содержащуюся в них информацию даже в случаях, когда текст, рисунки, видео, аудио, трехмерные карты, полноцветная графика, фото и бизнес-логика объединяются в одном файле или PDF-портфолио.

  • Простота подписи. Любой пользователь может поставить электронную подпись на документе PDF, используя бесплатное ПО Adobe Reader XI или Adobe Reader для мобильных устройств. Формат PDF предусматривает поддержку обычных цифровых изображений подписи, сертифицируемых подписей, заверяемых независимыми центрами сертификации.

  • Возможность поиска. В файле легко провести поиск по тексту или метаданным, включая сканированный текст, преобразованный с помощью технологии оптического распознавания символов (OCR).

  • Расширенный доступ. Файлы PDF более доступны для людей с ограниченными возможностями (слабое зрение или слепота).

  • Широкое распространение.


Спецификации Adobe PDF

  • 1993 — PDF 1.0 / Acrobat 1.0
  • 1994 — PDF 1.1 / Acrobat 2.0
  • 1996 — PDF 1.2 / Acrobat 3.0
  • 2000 — PDF 1.3 / Acrobat 4.0
  • 2001 — PDF 1.4 / Acrobat 5.0
  • 2003 — PDF 1.5 / Acrobat 6.0
  • 2005 — PDF 1.6 / Acrobat 7.0
  • 2006 — PDF 1.7 / Acrobat 8.0
  • 2006 — PDF 1.7 / Acrobat 8.2
  • 2008 — PDF 1.7, Adobe Extension Level 3 / Acrobat 9.0
  • 2009 — PDF 1.7, Adobe Extension Level 5 / Acrobat 9.1


Версии Adobe PDF

Год Версия Новые возможности Версия ПО
1993 PDF 1.0 Acrobat 1.0
1994 PDF 1.1 пароли ссылки потоки, независимая от устройства цветопередача Acrobat 2.0
1996 PDF 1.2 интерактивные элементы, обработка событий мыши, мультимедийные типы, уникод, улучшенное представление цвета и графики Acrobat 3.0
1999 PDF 1.3 цифровые подписи, цветовые пространства ICC и DeviceN, JavaScript Acrobat 4.0
2001 PDF 1.4 JBIG2, прозрачность, текстовый слой OCR Acrobat 5.0
2003 PDF 1.5 JPEG 2000, связанное мультимедиа, объектные потоки, перекрестные потоки, слои Acrobat 6.0
2005 PDF 1.6 внедренное мультимедиа, 3D, XML-формы, AES-шифрование Acrobat 7.0
2006 PDF 1.7 Acrobat 8.0
2008 PDF 1.7, AEL3 AES-шифрование 256-битным ключом Acrobat 9.0
2009 PDF 1.7, AEL5 XFA 3.0 Acrobat 9.1
2011 PDF 1.7, AEL8 Acrobat X (10)


Разновидность формата PDF для долгосрочного архивного хранения электронных документов - PDF/A

PDF/A (англ. Portable Document Format/A) — стандарт ISO 19005-1:2005 (опубликован 1 октября 2005 года) для долгосрочного архивного хранения электронных документов. Основа - описание стандарта PDF версии 1.4 от Adobe Systems Inc. (использовался в Adobe Acrobat 5).

PDF/A - подмножество формата PDF, из которого исключены особенности, не соответствующие требованиям к данным для долгосрочного архивного хранения. Реализован аналогично PDF/X.

Основные элементы соответствия требованиям PDF/A:

  • Запрещение встраивания аудио- и видео
  • Запрещено встраивание кода на Javascript и команд на запуск исполняемых файлов.
  • Все шрифты должны внедряться и они должны быть легально внедряемы для неограниченного универсального отображения. Это касается и так называемых стандартных шрифтов Postscript - Times или Helvetica.
  • Цветовые пространства определяются независимым от устройства способом.
  • Шифрование не разрешено.
  • Предписывается использование метаданных на основании стандартов.

2022: Хакеры нашли способ заражать компьютеры вирусом с помощью файлов в формате pdf

В середине мая 2022 года стало известно о том, что в интернете стали все чаще использовать документы в формате pdf для взлома компьютеров. В отчете HP Wolf Security говорится, как хакеры с их помощью научились получать доступ к практически любому компьютеру.

Согласно отчету HP Wolf Security, на электронную почту пользователям приходит письмо с сообщением о скорой выплате на имя владельца почты. К письму прикреплен файл в формате pdf. Открытие файла на персональном компьютее позволяет хакерам дистанционно запустить вредоносное программное обеспечение по ссылке внутри документа.

Хакеры нашли способ заражать компьютеры вирусом с помощью файлов в формате pdf

Исследователи обнаружили, что попытка открыть pdf через программу Adobe Reader приведет к тому, что пользователю предложат воспользоваться текстовым редактором Microsoft Word, так как внутри содержится файл docx. Хакеры смогли скрыть вирус для систем защиты и открытый документ будет указан, как проверенный.

Злоумышленники при атаках используют уязвимость CVE-2017-11882, исправленную в ноябре 2017 года. В ПО Microsoft Office существует уязвимость удаленного выполнения кода, когда ПО не может правильно обрабатывать объекты в памяти. Хакер, успешно воспользовавшийся уязвимостью, может запустить произвольный код в контексте текущего пользователя. Если текущий пользователь вошел в систему с правами администратора, злоумышленник может получить контроль над уязвимой системой. Затем злоумышленник может установить программы, просматривать, изменять или удалять данные, или же создавать новые учетные записи с полными правами пользователя. Пользователи, чьи учетные записи имеют меньше прав пользователя в системе, могут быть менее затронуты, чем пользователи, которые работают с правами администратора. В ПО для системы безопасности устраняет уязвимость, исправляя способ обработки объектов в памяти уязвимым компонентом Office.

Microsoft Office существует уязвимость удаленного выполнения кода, когда программное обеспечение не может правильно обрабатывать объекты в памяти. Злоумышленник, успешно воспользовавшийся уязвимостью, может запустить произвольный код в контексте текущего пользователя. В случае, если текущий пользователь вошел в систему с правами администратора, злоумышленник может получить контроль над уязвимой системой. Затем злоумышленник может установить программы; просматривать, изменять или удалять данные; или создайте новые учетные записи с полными правами пользователя. Пользователи, чьи учетные записи имеют меньше прав пользователя в системе, могут быть менее затронуты, чем пользователи, которые работают с правами администратора.

Специалисты HP Wolf Security констатировали, что многие пользователи так и не загрузили необходимое обновление для своих ОС. Вредоносные объекты этого семейства эксплуатируют уязвимость Microsoft Equation Editor (компонент Microsoft Office). При удачном исходе атаки злоумышленник может выполнить свой код от имени пользователя. Исследователи показали, как злоумышленники используют для заражения систем документы pdf. Встраивание файлов, загрузка удаленно размещенных эксплойтов и шифрование шелл-кода:

  • REMMITANCE INVOICE.pdf

05dc0792a89e18f5485d9127d2063b343cfd2a5d497c9b5df91dc687f9a1341d

  • has been verified. however pdf, jpeg, xlsx, .docx

250d2cd13474133227c3199467a30f4e1e17de7c7c4190c4784e46ecf77e51fe

  • f_document_shp.doc

165305d6744591b745661e93dc9feaea73ee0a8ce4dbe93fde8f76d0fc2f8c3f

  • f_document_shp.doc_object_00001707.raw

297f318975256c22e5069d714dd42753b78b0a23e24266b9b67feb7352942962

  • Exploit shellcode

f1794bfabeae40abc925a14f4e9158b92616269ed9bcf9aff95d1c19fa79352e

  • fresh.exe (Snake Keylogger)

20a3e59a047b8a05c7fd31b62ee57ed3510787a979a23ce1fde4996514fae803

  • External OLE reference URL

hxxps://vtaurl[.]com/IHytw

  • External OLE reference final URL

hxxp://192.227.196[.]211/tea_shipping/f_document_shp.doc

  • Snake Keylogger payload URL

hxxp://192.227.196[.]211/FRESH/fresh.exe

  • Snake Keylogger exfiltration via SMTP

mail.saadzakhary[.]com:587[2]

2014: Использование PDF в России

30 сентября 2014 года компания Abbyy Россия сообщила о завершении исследования рынка PDF-документов в России и сценариях работы с PDF-документами.

Как используют PDF в России

В опросе приняли участие 500 офисных сотрудников из Москвы, Санкт-Петербурга и ряда городов, работающие в различных отраслях индустрии государственного и частного секторов. Согласно этому документу, в 2014 году респонденты отмечали рост объемов документов в формате PDF. Ещё результаты исследования дали понять, что переход на электронный документооборот произошел далеко не везде: 68% офисных служащих считают, что поток бумажных документов возрос.

Наиболее частые сценарии работы с PDF-документами:

  • 62% опрошенных часто ищут информацию в тексте PDF;
  • 60% копируют текст из PDF;
  • 54% регулярно работают со страницами в документе:
    • меняют их порядок,
    • добавляют новые
    • удаляют существующие;

  • 52% вносят мелкие правки в текст PDF, исправляют ошибки или опечатки;
  • 46% объединяют файлы различных форматов в единый PDF.

Ссылки

Примечания

  1. Язык описания страниц. Используется, в основном, в настольных издательских системах
  2. PDF Malware Is Not Yet Dead