Transformar y editar PDF

6 Febrero 2009

En esta entrada vamos a ver varias herramientas para transformar y editar archivos PDF. Las cuatro primeras son para ser usadas desde la consola de texto y permiten transformar archivos PDF en otros formatos más facilmente editables. Las dos últimas son aplicaciones gráficas que permiten modificar o editar directamente archivos PDF.

pdf

pdftotext

Transforma archivos pdf en archivos de texto (txt).

pdftotxt -layout archivo.pdf archivo.txt

La opción -layout intenta mantener (en la medida de lo posible) el formato original del texto.

Más información en http://linux.die.net/man/1/pdftotext

Leer el resto de la entrada…

Pdftk es un programa que permite realizar diversas operaciones con archivos pdf. Podemos instalarlo fácilmente usando Synaptic (o si lo preferimos apt-get o aptitude). Una vez instalado lo manejaremos mediante la consola de texto.

Vamos a ver un par de ejemplos prácticos:

Ejemplo 1: Tenemos un artículo sobre Richard Stallman en pdf y otro sobre Linus Torvalds, también en pdf, y queremos unirlos en uno solo. Vamos a la consola y escribimos:

pdftk stallman.pdf torvalds.pdf cat output gnu/linux.pdf

Los archivos entrantes son stallman.pdf y torvalds.pdf, el archivo saliente, unión de los dos anteriores, es gnu/linux.pdf

mazo

Ejemplo 2: Hemos encontrado, en diferentes números de una revista editada en formato pdf, unos tutoriales sobre Open Office y queremos extraerlos y juntarlos en un único archivo, a modo de monográfico sobre Open Office. Escribimos:

pdftk A=revista07.pdf B=revista09.pdf C=revista10.pdf cat A63-72 B10-20 C5-19 output OpenOffice.pdf

Este último ejemplo lo vamos a explicar un poco más en profundidad:

Leer el resto de la entrada…