Skip to content

mehr über pdfs gelernt

mit ghostscript kann man ziemlich viel machen, um pdfs zu bearbeiten, auch wenn die bedienung ein bisschen anstrengend und gewöhnungsbedürftig ist.

bei manchen pdfs kommt es vor, dass die seiten ein bissschen größer sind als z.b. a4, weil der anschnitt noch dabei ist (z.b. 3mm mehr rand links, rechts, oben und unten), aber die infos über das rohformat nicht korrekt sind, weil das pdf statt als a4 format (210x297mm) eine mit anschnitt inkludierte papiergröße (z.b. 216mmx303mm) aufweist.

mit pdfinfo -box input.pdf kann man infos über die angegebene datei herausfinden, wobei die angaben dort noch nicht heißen, dass die datei nicht relativ easy geändert werden kann. (das hängt davon ab, wie und mit welchem programm die datei erstellt wurde.)

Page size:      612.283 x 858.898 pts
MediaBox:           0.00     0.00   612.28   858.90
CropBox:            0.00     0.00   612.28   858.90
BleedBox:           0.00     0.00   612.28   858.90
TrimBox:            0.00     0.00   612.28   858.90
ArtBox:             0.00     0.00   612.28   858.90

wenn keine angaben gemacht wurden, geht’s mit ghostscript, weil da die angaben hinzugefügt werden können.

gs -sDEVICE=pdfwrite -o output.pdf -c "[/TrimBox [8.5 8.5 603.783 850.398] /PAGES pdfmark" -f input.pdf

alternativ können schon vorhandene felder auch einfach ersetzt werden. wichtig: die anzahl der zeichen sollte sich dadurch nicht ändern. (zum rausfinden, was man ersetzen möchte, einfach die datei in einem editor wie vim öffnen und nach TrimBox, CropBox, etc. suchen)

sed 's#TrimBox\[0.0 0.0 612.283 858.898\]#TrimBox\[8.5 8.5 603.780 850.390\]#g' input.pdf > output.pdf

wie aber schon im letzten beitrag pdf splitten, joinen, etc kann man vieles auch einfacher mitpdfcrop machen