Как узнать количество страниц, с помощью какой программы был составлен тот или иной pdf документ. Я хочу показать Вам, как через консоль под операционной системой Ubuntu 10.10 обработать список документов и отсортировать по нужным критериям. И так поехали!!!

 

Сперва создадим каталог test_pdf и перенесем некоторое количество документов pdf в него. После чего создадим скрипт для обработки с ниже следующим содержанием:

keiz@ekz:~/test_pdf$ nano count_pdf

 

#!/bin/sh

for f in *.pdf; do

echo -n “$f: “

pdfinfo “$f” 2>/dev/null | grep Pages | cut -d “:” -f 2

done

, что делает данный скрипт, в переменную $f помещает листинг всех найденных документов, далее с помощью утилиты просмотра информации pdfinfo, pdf разбирается и отфильтровывается вывод по строке Pages (страницы).

Окончательным шагом нужно дать нашему скрипту права на исполнение и запустить:

keiz@ekz:~/test_pdf$ chmod +x count_pdf

keiz@ekz:~/test_pdf$ ./count_pdf

 

Я специально оформил вывод в качестве таблицы, чтобы Вы лучше представляли, на что способен разбор нужных полей и каков полученный результат.

 

Время – деньги. Как управлять своим временем.pdf:

130

Время – деньги. Как подчинить время и заставить его работать на вас.pdf:

354

Глеб.Архангельский.Тайм-драйв.pdf:

114

Джулия Моргенстерн. Тайм-менеджмент. Искусство планирования и управления своим временем и своей жизнью.pdf

130

Интегрированный тайм-менеджмент. Стив Прентис.pdf:

145

Как находить два лишних часа каждый день. Джуди Джеймс.pdf:

337

Как привести дела в порядок. Искусство продуктивности без стресса. Дэвид Аллен.pdf:

358

Как управлять временем. С макимальной отдачей без спешки.pdf:

162

 

Данные числа есть количество страниц в документах. Результат достигнут.

 

Сортировку можно варьировать и получать различные результаты.

К примеру, вот пример данных о документе pdf которые можно получить:

 

keiz@ekz:~/test_pdf$ pdfinfo “Время – деньги. Как управлять своим временем.pdf”

Title:

Subject:

Keywords:

Author:

Creator: ABBYY FineReader

Producer:

CreationDate: Sat Dec 9 15:30:53 2006

ModDate: Sat Dec 9 15:30:53 2006

Tagged: no

Pages: 130

Encrypted: no

Page size: 339 x 555 pts

File size: 3266460 bytes

Optimized: yes

PDF version: 1.2

 

Рассмотрим вариант вывода через какую программу был сделан документ. Всего лишь надо будет поменять параметр Pages на Creator:

Делаем по аналогии, создаем скрипт следующего содержания и запускаем:

keiz@ekz:~/test_pdf$ nano creator_pdf

keiz@ekz:~/test_pdf$ chmod +x creator_pdf

keiz@ekz:~/test_pdf$ ./creator_pdf

 

Полученный результат:

Время – деньги. Как управлять своим временем.pdf:

ABBYY FineReader

Время – деньги. Как подчинить время и заставить его работать на вас.pdf:

ABBYY FineReader

Глеб.Архангельский.Тайм-драйв.pdf:

Adobe Acrobat 7.0

Джулия Моргенстерн. Тайм-менеджмент. Искусство планирования и управления своим временем и своей жизнью.pdf

ABBYY FineReader

Интегрированный тайм-менеджмент. Стив Прентис.pdf:

ABBYY FineReader

Как находить два лишних часа каждый день. Джуди Джеймс.pdf:

ABBYY FineReader

Как привести дела в порядок. Искусство продуктивности без стресса. Дэвид Аллен.pdf:

ABBYY FineReader

Как управлять временем. С макимальной отдачей без спешки.pdf:

ABBYY FineReader

Время – деньги. Как управлять своим временем.pdf:

ABBYY FineReader

Время – деньги. Как подчинить время и заставить его работать на вас.pdf:

ABBYY FineReader

Надеюсь Вам понравилось. Задача выполнена более чем превосходно и главное это работающий примеры.

 

 

 

 

От ekzorchik

Всем хорошего дня, меня зовут Александр. Я под ником - ekzorchik, являюсь автором всех написанных, разобранных заметок. Большинство вещей с которыми мне приходиться разбираться, как на работе, так и дома выложены на моем блоге в виде пошаговых инструкции. По сути блог - это шпаргалка онлайн. Каждая новая работа где мне случалось работать вносила новые знания и нюансы работы и соответственно я расписываю как сделать/решить ту или иную задачу. Это очень помогает. Когда сам разбираешь задачу, стараешься ее приподнести в виде структурированной заметки чтобы было все наглядно и просто, то процесс усвоения идет в гору. Также прошу на https://win.ekzorchik.ru https://lin.ekzorchik.ru https://net.ekzorchik.ru https://voip.ekzorchik.ru https;//home.ekzorchik.ru