Как узнать количество страниц, с помощью какой программы был составлен тот или иной pdf документ. Я хочу показать Вам, как через консоль под операционной системой Ubuntu 10.10 обработать список документов и отсортировать по нужным критериям. И так поехали!!!
Сперва создадим каталог test_pdf и перенесем некоторое количество документов pdf в него. После чего создадим скрипт для обработки с ниже следующим содержанием:
keiz@ekz:~/test_pdf$ nano count_pdf
#!/bin/sh
for f in *.pdf; do
echo -n “$f: “
pdfinfo “$f” 2>/dev/null | grep Pages | cut -d “:” -f 2
done
, что делает данный скрипт, в переменную $f помещает листинг всех найденных документов, далее с помощью утилиты просмотра информации pdfinfo, pdf разбирается и отфильтровывается вывод по строке Pages (страницы).
Окончательным шагом нужно дать нашему скрипту права на исполнение и запустить:
keiz@ekz:~/test_pdf$ chmod +x count_pdf
keiz@ekz:~/test_pdf$ ./count_pdf
Я специально оформил вывод в качестве таблицы, чтобы Вы лучше представляли, на что способен разбор нужных полей и каков полученный результат.
Время – деньги. Как управлять своим временем.pdf: |
130 |
Время – деньги. Как подчинить время и заставить его работать на вас.pdf: |
354 |
Глеб.Архангельский.Тайм-драйв.pdf: |
114 |
Джулия Моргенстерн. Тайм-менеджмент. Искусство планирования и управления своим временем и своей жизнью.pdf |
130 |
Интегрированный тайм-менеджмент. Стив Прентис.pdf: |
145 |
Как находить два лишних часа каждый день. Джуди Джеймс.pdf: |
337 |
Как привести дела в порядок. Искусство продуктивности без стресса. Дэвид Аллен.pdf: |
358 |
Как управлять временем. С макимальной отдачей без спешки.pdf: |
162 |
Данные числа есть количество страниц в документах. Результат достигнут.
Сортировку можно варьировать и получать различные результаты.
К примеру, вот пример данных о документе pdf которые можно получить:
keiz@ekz:~/test_pdf$ pdfinfo “Время – деньги. Как управлять своим временем.pdf”
Title:
Subject:
Keywords:
Author:
Creator: ABBYY FineReader
Producer:
CreationDate: Sat Dec 9 15:30:53 2006
ModDate: Sat Dec 9 15:30:53 2006
Tagged: no
Pages: 130
Encrypted: no
Page size: 339 x 555 pts
File size: 3266460 bytes
Optimized: yes
PDF version: 1.2
Рассмотрим вариант вывода через какую программу был сделан документ. Всего лишь надо будет поменять параметр Pages на Creator:
Делаем по аналогии, создаем скрипт следующего содержания и запускаем:
keiz@ekz:~/test_pdf$ nano creator_pdf
keiz@ekz:~/test_pdf$ chmod +x creator_pdf
keiz@ekz:~/test_pdf$ ./creator_pdf
Полученный результат:
Время – деньги. Как управлять своим временем.pdf: |
ABBYY FineReader |
Время – деньги. Как подчинить время и заставить его работать на вас.pdf: |
ABBYY FineReader |
Глеб.Архангельский.Тайм-драйв.pdf: |
Adobe Acrobat 7.0 |
Джулия Моргенстерн. Тайм-менеджмент. Искусство планирования и управления своим временем и своей жизнью.pdf |
ABBYY FineReader |
Интегрированный тайм-менеджмент. Стив Прентис.pdf: |
ABBYY FineReader |
Как находить два лишних часа каждый день. Джуди Джеймс.pdf: |
ABBYY FineReader |
Как привести дела в порядок. Искусство продуктивности без стресса. Дэвид Аллен.pdf: |
ABBYY FineReader |
Как управлять временем. С макимальной отдачей без спешки.pdf: |
ABBYY FineReader |
Время – деньги. Как управлять своим временем.pdf: |
ABBYY FineReader |
Время – деньги. Как подчинить время и заставить его работать на вас.pdf: |
ABBYY FineReader |
Надеюсь Вам понравилось. Задача выполнена более чем превосходно и главное это работающий примеры.