Преобразуем pdf документы в легковестный djvu под Ubuntu 10.10

Posted by

Одним из наилучших путей преобразования документа из формата в является использование утилиты . При этом, если исходный pdf-файл содержит распознанный текст, URL, содержание, – они будут корректно работать и в конечном djvu-файле.

keiz@ekz:~/test_pdf$ aptitude search pdf2djvu

p pdf2djvu — конвертор из PDF в DjVu

 

keiz@ekz:~/test_pdf$ aptitude show pdf2djvu

Пакет: pdf2djvu

Состояние: не установлен

Версия: 0.7.4-1build2

 

Устанавливаем:

keiz@ekz:~/test_pdf$ sudo aptitude install pdf2djvu

Перед применением следует хотя бы бегло ознакомиться с основными опциями командной строки: man pdf2djvu

В директорию test_pdf я поместил pdf документ:

keiz@ekz:~$ mkdir test_pdf

 

Обзор исходного pdf файла:

keiz@ekz:~/test_pdf$ file volume_activate.pdf

volume_activate.pdf: PDF document, version 1.5

 

Преобразуем pdf в djvu при 400 dpi:

keiz@ekz:~/test_pdf$ pdf2djvu -o volume.djvu -d 400 volume_activate.pdf

volume_activate.pdf :

— page #1 -> #1

0,095 bits/pixel; 1,708:1, 41,46% saved, 627055 bytes in, 367083 bytes out

keiz@ekz:~/test_pdf$

 

Преобразуем pdf в djvu при 1200 dpi:

keiz@ekz:~/test_pdf$ pdf2djvu -o backtrack.djvu -d 1200 BACKTRACK_CUDA_v2.0.pdf

BACKTRACK_CUDA_v2.0.pdf:

— page #1 -> #1

— page #2 -> #2

— page #3 -> #3

— page #4 -> #4

— page #5 -> #5

— page #6 -> #6

— page #7 -> #7

— page #8 -> #8

— page #9 -> #9

— page #10 -> #10

— page #11 -> #11

— page #12 -> #12

— page #13 -> #13

— page #14 -> #14

— page #15 -> #15

— page #16 -> #16

— page #17 -> #17

— page #18 -> #18

— page #19 -> #19

— page #20 -> #20

— page #21 -> #21

— page #22 -> #22

— page #23 -> #23

— page #24 -> #24

— page #25 -> #25

— page #26 -> #26

— page #27 -> #27

— page #28 -> #28

— page #29 -> #29

— page #30 -> #30

— page #31 -> #31

0,017 bits/pixel; 0,228:1, -338,85% saved, 2002690 bytes in, 8788743 bytes out

 

Как видим, при увеличении качества документа с 1200 dpi возрастает размер полученного файла:

keiz@ekz:~/test_pdf$ dir -hl

итого 12M

-rwx—— 1 keiz keiz 2,0M 2011-01-26 13:48 BACKTRACK_CUDA_v2.0.pdf

-rw-r—r— 1 keiz keiz 8,4M 2012-06-26 21:27 backtrack.djvu

Число, которое стоит после опции —d, – это разрешительная способность (точек/дюйм); его значение можно варьировать от 72 до 6000. Чем больше значение, тем большего качества будет документ при, соответственно, большем размере конечного DJVU-файла, и наоборот. В большинстве случаях достаточно поставить число 300 или 400; иногда можно поэкспериментировать, используя разные значения разрешительной способности, чтобы достичь оптимального соотношения качества и размера. По дефолту используется значение в 300 dpi.

Что представляет из себя в итоге полученный файл:

keiz@ekz:~/test_pdf$ file volume.djvu

volume.djvu: DjVu multiple page document

 

Данный файл спокойно читается все моими мобильными устройствами. А что же с размером?

keiz@ekz:~/test_pdf$ dir -hl

итого 984K

-rwx—— 1 keiz keiz 613K 2011-02-04 10:26 volume_activate.pdf

-rw-r—r— 1 keiz keiz 359K 2012-06-26 21:08 volume.djvu

Размер документа уменьшился почти в 2 раза. Данной утилитой стоит пользоваться. Работает.

Leave a Reply

Ваш e-mail не будет опубликован. Обязательные поля помечены *

1 + 17 =