Одним из наилучших путей преобразования документа из формата PDF в DJVU является использование утилиты pdf2djvu. При этом, если исходный pdf-файл содержит распознанный текст, URL, содержание, – они будут корректно работать и в конечном djvu-файле.
keiz@ekz:~/test_pdf$ aptitude search pdf2djvu
p pdf2djvu – конвертор из PDF в DjVu
keiz@ekz:~/test_pdf$ aptitude show pdf2djvu
Пакет: pdf2djvu
Состояние: не установлен
Версия: 0.7.4-1build2
Устанавливаем:
keiz@ekz:~/test_pdf$ sudo aptitude install pdf2djvu
Перед применением следует хотя бы бегло ознакомиться с основными опциями командной строки: man pdf2djvu
В директорию test_pdf я поместил pdf документ:
keiz@ekz:~$ mkdir test_pdf
Обзор исходного pdf файла:
keiz@ekz:~/test_pdf$ file volume_activate.pdf
volume_activate.pdf: PDF document, version 1.5
Преобразуем pdf в djvu при 400 dpi:
keiz@ekz:~/test_pdf$ pdf2djvu -o volume.djvu -d 400 volume_activate.pdf
volume_activate.pdf :
– page #1 -> #1
0,095 bits/pixel; 1,708:1, 41,46% saved, 627055 bytes in, 367083 bytes out
keiz@ekz:~/test_pdf$
Преобразуем pdf в djvu при 1200 dpi:
keiz@ekz:~/test_pdf$ pdf2djvu -o backtrack.djvu -d 1200 BACKTRACK_CUDA_v2.0.pdf
BACKTRACK_CUDA_v2.0.pdf:
– page #1 -> #1
– page #2 -> #2
– page #3 -> #3
– page #4 -> #4
– page #5 -> #5
– page #6 -> #6
– page #7 -> #7
– page #8 -> #8
– page #9 -> #9
– page #10 -> #10
– page #11 -> #11
– page #12 -> #12
– page #13 -> #13
– page #14 -> #14
– page #15 -> #15
– page #16 -> #16
– page #17 -> #17
– page #18 -> #18
– page #19 -> #19
– page #20 -> #20
– page #21 -> #21
– page #22 -> #22
– page #23 -> #23
– page #24 -> #24
– page #25 -> #25
– page #26 -> #26
– page #27 -> #27
– page #28 -> #28
– page #29 -> #29
– page #30 -> #30
– page #31 -> #31
0,017 bits/pixel; 0,228:1, -338,85% saved, 2002690 bytes in, 8788743 bytes out
Как видим, при увеличении качества документа с 1200 dpi возрастает размер полученного файла:
keiz@ekz:~/test_pdf$ dir -hl
итого 12M
-rwx—— 1 keiz keiz 2,0M 2011-01-26 13:48 BACKTRACK_CUDA_v2.0.pdf
-rw-r–r– 1 keiz keiz 8,4M 2012-06-26 21:27 backtrack.djvu
Число, которое стоит после опции –d, – это разрешительная способность (точек/дюйм); его значение можно варьировать от 72 до 6000. Чем больше значение, тем большего качества будет документ при, соответственно, большем размере конечного DJVU-файла, и наоборот. В большинстве случаях достаточно поставить число 300 или 400; иногда можно поэкспериментировать, используя разные значения разрешительной способности, чтобы достичь оптимального соотношения качества и размера. По дефолту используется значение в 300 dpi.
Что представляет из себя в итоге полученный файл:
keiz@ekz:~/test_pdf$ file volume.djvu
volume.djvu: DjVu multiple page document
Данный файл спокойно читается все моими мобильными устройствами. А что же с размером?
keiz@ekz:~/test_pdf$ dir -hl
итого 984K
-rwx—— 1 keiz keiz 613K 2011-02-04 10:26 volume_activate.pdf
-rw-r–r– 1 keiz keiz 359K 2012-06-26 21:08 volume.djvu
Размер документа уменьшился почти в 2 раза. Данной утилитой стоит пользоваться. Работает.