Примеры работы с утилитой pdfinfo в системе Ubuntu 10.10

Posted by

Как узнать количество страниц, с помощью какой программы был составлен тот или иной pdf документ. Я хочу показать Вам, как через консоль под операционной системой обработать список документов и отсортировать по нужным критериям. И так поехали!!!

 

Сперва создадим каталог test_pdf и перенесем некоторое количество документов pdf в него. После чего создадим скрипт для обработки с ниже следующим содержанием:

keiz@ekz:~/test_pdf$ nano count_pdf

 

#!/bin/sh

for f in *.pdf; do

echo -n «$f: «

«$f» 2>/dev/null | grep Pages | cut -d «:» -f 2

done

, что делает данный скрипт, в переменную $f помещает листинг всех найденных документов, далее с помощью утилиты просмотра информации pdfinfo, pdf разбирается и отфильтровывается вывод по строке Pages (страницы).

Окончательным шагом нужно дать нашему скрипту права на исполнение и запустить:

keiz@ekz:~/test_pdf$ chmod +x count_pdf

keiz@ekz:~/test_pdf$ ./count_pdf

 

Я специально оформил вывод в качестве таблицы, чтобы Вы лучше представляли, на что способен разбор нужных полей и каков полученный результат.

 

Время — деньги. Как управлять своим временем.pdf:

130

Время — деньги. Как подчинить время и заставить его работать на вас.pdf:

354

Глеб.Архангельский.Тайм-драйв.pdf:

114

Джулия Моргенстерн. Тайм-менеджмент. Искусство планирования и управления своим временем и своей жизнью.pdf

130

Интегрированный тайм-менеджмент. Стив Прентис.pdf:

145

Как находить два лишних часа каждый день. Джуди Джеймс.pdf:

337

Как привести дела в порядок. Искусство продуктивности без стресса. Дэвид Аллен.pdf:

358

Как управлять временем. С макимальной отдачей без спешки.pdf:

162

 

Данные числа есть количество страниц в документах. Результат достигнут.

 

Сортировку можно варьировать и получать различные результаты.

К примеру, вот пример данных о документе pdf которые можно получить:

 

keiz@ekz:~/test_pdf$ pdfinfo «Время — деньги. Как управлять своим временем.pdf»

Title:

Subject:

Keywords:

Author:

Creator: ABBYY FineReader

Producer:

CreationDate: Sat Dec 9 15:30:53 2006

ModDate: Sat Dec 9 15:30:53 2006

Tagged: no

Pages: 130

Encrypted: no

Page size: 339 x 555 pts

File size: 3266460 bytes

Optimized: yes

PDF version: 1.2

 

Рассмотрим вариант вывода через какую программу был сделан документ. Всего лишь надо будет поменять параметр Pages на Creator:

Делаем по аналогии, создаем скрипт следующего содержания и запускаем:

keiz@ekz:~/test_pdf$ nano creator_pdf

keiz@ekz:~/test_pdf$ chmod +x creator_pdf

keiz@ekz:~/test_pdf$ ./creator_pdf

 

Полученный результат:

Время — деньги. Как управлять своим временем.pdf:

ABBYY FineReader

Время — деньги. Как подчинить время и заставить его работать на вас.pdf:

ABBYY FineReader

Глеб.Архангельский.Тайм-драйв.pdf:

Adobe Acrobat 7.0

Джулия Моргенстерн. Тайм-менеджмент. Искусство планирования и управления своим временем и своей жизнью.pdf

ABBYY FineReader

Интегрированный тайм-менеджмент. Стив Прентис.pdf:

ABBYY FineReader

Как находить два лишних часа каждый день. Джуди Джеймс.pdf:

ABBYY FineReader

Как привести дела в порядок. Искусство продуктивности без стресса. Дэвид Аллен.pdf:

ABBYY FineReader

Как управлять временем. С макимальной отдачей без спешки.pdf:

ABBYY FineReader

Время — деньги. Как управлять своим временем.pdf:

ABBYY FineReader

Время — деньги. Как подчинить время и заставить его работать на вас.pdf:

ABBYY FineReader

Надеюсь Вам понравилось. Задача выполнена более чем превосходно и главное это работающий примеры.

 

 

 

 

Leave a Reply

Ваш e-mail не будет опубликован. Обязательные поля помечены *

пять + одиннадцать =