1. Nach PDF oder nach PDF/A-1b konvertieren?

Word, OneNote oder PowerPoint Dateien werden häufig in das PDF Format konvertiert um sie an digitale Archive abzuliefern. Für die Archivierung empfehlen wir nicht das normale PDF Format zu verwenden, sondern die Konformitätsstufe PDF/A-1b (ein ISO Standard), weil diese für den Langzeiterhalt besser geeignet ist. Man erkennt eine PDF/A Datei am blauen Balken zuoberst in der Dateiansicht von Adobe Acrobat (siehe Bild).


Bild: Adobe Acrobat zeigt für eine PDF/A Datei zuoberst einen blauen Balken.

Die Konvertierung nach PDF, anstelle von PDF/A-1b, ist weniger nachhaltig, kann jedoch gewisse Konvertierungsfehler vermeiden (insbesondere Fehler in Formeln, Umlauten, speziellen Fonts, Textschreibfehler, Kommentaren, transparenten Objekten, Vektorgraphiken sowie mehrfache Zeichenebenen).

2. OneNote via Word nach PDF

Beim direkten Export von MS OneNote nach PDF/A-1b oder PDF gehen diejenigen Hyperlinks verloren, welche dem Text unterlegt sind. Um dies zu verhindern sollten Sie die OneNote Abschnitte zuerst nach MS Word exportieren. (Die OneNote Einträge vorher auf die Seitenbreite limitieren.) Die MS Word Datei können Sie danach, wie unten beschrieben, in ein PDF oder PDF/A-1b Format konvertieren.

3. Wahl der Konvertierungsmethode

Für die Konvertierung von MS Word oder PowerPoint nach PDF/A-1b oder PDF gibt es vier Methoden, welche sich in Rechenzeit und PDF Qualität unterscheiden. Bei grossen und komplexen Dokumenten muss ein Kompromiss zwischen Qualität des erzeugten PDFs und Rechenzeit getroffen werden (Tabelle 1).

Tabelle 1: Eigenschaften der vier Konvertierungsmethoden nach PDF/A-1b oder PDF (siehe Anhang für weitere Details)


Unterlegte Hyperlinks gehen verloren

Unterlegte Hyperlinks bleiben erhalten

Schnelle Konvertierung

PDF Drucker*

Als PDF speichern*

Langsame Konvertierung


PDFMaker

Adobe Acrobat Pro

* Verweise auf Fussnoten reagieren nicht mehr auf Mausklick, bleiben jedoch lesbar

4. Beschreibung der Konvertierungsmethoden

Wir beschreiben hier vier Methoden um PDF/A-1b (oder PDF) Dateien aus MS Word oder MS PowerPoint Dateien zu erzeugen. Dabei kommt nur die Methode «als PDF speichern» ohne kostenpflichtige Software aus (Adobe Reader). Die anderen drei Methoden benötigen kostenpflichtige Adobe Acrobat Produkte[1].

Sie sollten die Qualität der erzeugten PDF Datei sorgfältig visuell überprüfen. Achten Sie dabei insbesondere auf Formeln, Hyperlinks, Sonderzeichen, Umlaute, spezielle Fonts, Textschreibfehler, Auswählen und Suchen im Text, Kommentare, Tabellen, Farben, transparente Objekte, Vektorgraphiken sowie mehrfache Zeichenebenen.

PDF Drucker

Für grosse wissenschaftliche Arbeiten empfehlen wir URLs von Hyperlinks im Text explizit anzugeben und den Adobe PDF Drucker zu benutzen (benützt Adobe Distiller): In MS Word oder MS PowerPoint unter dem Menüpunkt „Datei“ wählen Sie die Schaltfläche „Drucken“. Unter „Drucker“ wählen Sie „Adobe PDF“ aus. (Falls das Feld „Adobe PDF“ fehlt, ist auf Ihrem Computer vermutlich nur Adobe Reader installiert.) Falls sie ein PDF/A-1b erzeugen möchten, wählen Sie „Druckereigenschaften“ an. Im Tab „Adobe PDF Einstelllungen“ wählen Sie in „Standardeinstellungen“ den Dropdown Menüpunkt „PDF/A-1b: 2005 (RGB)“ aus. Wählen Sie „Drucken“ um die PDF Datei zu erzeugen. [2]

Als PDF speichern

Eine Datei kann in Word oder PowerPoint als PDF gespeichert werden. Dazu unter dem Menü „Datei“, „Speichern als“ auswählen (nicht „speichern als Adobe pdf“), dann unter Dateityp „PDF (*.pdf)“ auswählen. Unter „Optionen…“ selektieren Sie „ISO19005-1-kompatibles PDF/A“ um eine PDF/A-1b Datei zu erzeugen (ISO19005-1 ist PDF/A-1; das erzeugte File erfüllt also mindestens PDF/A-1b).[3]

PDFMaker

Eine Word oder PowerPoint Datei kann mit dem Acrobat PDFMaker als PDF gespeichert werden. Dazu das Dokument in Word oder PowerPoint öffnen, das Menü „Acrobat“ auswählen, dann Grundeinstellungen. Falls erwünscht PDF/A-1b wählen (einmalig für jede Installation). Dann erzeugen Sie das PDF Dokument entweder im Menü „Acrobat“ mit dem Menüpunkt „PDF erstellen“ oder im Menü „Datei“ mit dem Menüpunkt „Als Adobe PDF speichern…“.[4]

Adobe Acrobat Pro

Sie können eine Word oder PowerPoint Datei mit Acrobat Pro oder Acrobat Pro DC konvertieren. Dies geschieht in folgenden Schritten: Öffnen Sie die Word oder PowerPoint Datei mit Adobe Acrobat Pro. Dann wählen Sie im Menü „Datei“ den Menüpunkt „Speichern als...“ und wählen „PDF/A“. Im nächsten Fenster wählen Sie Dateinamen und Speicherort sowie die Schaltfläche „Einstellungen…“. Falls sie nach PDF/A-1b konvertieren möchten wählen Sie im nächsten Fenster „PDF/A-1b“ und “sRGB.“ [5]

Anhang: Unsere Tests zu den verschiedenen Konvertierungsmethoden

Um Vor- und Nachteile dieser vier Methoden zu testen wurden fünf Word Dateien und fünf PowerPoint Dateien nach PDF/A-1b konvertiert (MS Office Professional Plus 2010, Version 14.0). Die Testdateien enthielten jeweils aufwendige wissenschaftliche Publikationen mit Figuren, Gleichungen und speziellen Schriftzeichen. Die produzierten PDF/A-1b Dateien wurden folgendermassen beurteilt:

Die Erhaltung von Tags oder Metadaten wurde nicht beachtet. Ebenso wurde die Erhaltung von Kommentaren unterhalb der PowerPoint Seiten nicht überprüft.

Für grosse wissenschaftliche Arbeiten ohne unterlegte Hyperlinks empfehlen wir die Methode mit dem PDF Drucker zu benutzen. Mit dieser Methode wurden bei den visuellen Kontrollen keine Unterschiede zum Original gefunden, und alle erzeugten Dateien waren auch wirklich konform mit dem PDF/A-1b Standard. Zudem erzeugte diese Methode die kleinsten Files, und die Rechenzeit dauerte auch für komplexe Dokumente (bis zu 40 Seiten) nur einige Sekunden (siehe Tabelle 2).

Tabelle 2: Resultate für die vier Konvertierungsmethoden

Kriterien

PDF Drucker

Als PDF speichern

PDFMaker

Adobe Acrobat Pro

Visuelle Überprüfung

Keine Fehler

Für vier der 10 Dateien waren einzelne Bilder nicht brauchbar, weil transparente Objekte undurchsichtig wurden.

Ein File konnte nicht zuverlässig konvertiert werden.

Keine Fehler, jedoch teilweise ungenügende Bildqualität, sowie teilweise Text, der weder such- noch kopierbar war.

Links und Verweise

Unterlegte Hyperlinks gebrochen; Verweise auf Fussnoten sind lesbar, aber reagieren nicht auf Mausklick

Verweise auf Fussnoten sind lesbar, aber reagieren nicht auf Mausklick

Keine Fehler

Keine Fehler

Adobe Preflight Überprüfung der Kompatibilität mit PDF/A-1b

Keine Fehler

Eine der zehn Dateien war keine gültige PDF/A-1b Datei.

Vier der 10 Files waren keine gültigen PDF/A-1b Dateien.

Keine Fehler

Grösse des PDF/A-1b Files

Bis zwei Mal grösser als Original

Bis sechs Mal grösser als Original

Bis fünf Mal grösser als Original

Bis vier Mal grösser als Original

Rechenzeit (Intel Core i7, 3.4 GHz)

Dauerte höchstens wenige Sekunden

Dauerte höchstens wenige Sekunden

Dauerte bis zu einigen Minuten

Dauerte bis zu einigen Minuten



[1] Adobe Acrobat Pro https://acrobat.adobe.com/ch/de/acrobat/pricing/compare-versions.html DC kann von ETH-Angehörigen bei https://idesnx.ethz.ch bestellt werden. Bitte kontaktieren Sie Ihren Informatik Support. Siehe auch Adobe Acrobat XI: Produktvergleich, https://acrobat.adobe.com/ch/de/acrobat/pricing/compare-versions.html (Stand 28.05.2020).

[2] Weitere Instruktionen auf folgender Webseite (Stand 28.05.2020): http://blogs.adobe.com/acrolaw/2007/01/pdfa_in_action . Acrobat Distiller konvertiert dabei von PostScript (*.ps) nach PDF. Auch auf dem kostenlosen OpenOffice 3 für Windows (Oracle) können Sie mit Distiller nach PDF/A-1b konvertieren.

[3] Folgende Webseite gibt weitere Instruktionen (Stand 28.05.2020): https://support.office.com/en-us/article/Save-as-PDF-d85416c5-7d77-4fd6-a216-6f4bf7c7c110#bm11

[4] Folgende Webseite gibt weitere Instruktionen (Stand 28.05.2020): http://helpx.adobe.com/acrobat/using/creating-pdfs-pdfmaker-windows.html

[5] Folgende Webseite gibt weitere Instruktionen (Stand 28.05.2020): http://blogs.adobe.com/acrolaw/2011/05/using-save-as-to-to-conform-to-pdfa