Page tree

Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

  • Dateien in seltenen Formaten sollten Sie möglichst in übliche Formate konvertieren. Dabei sollten Sie jeweils Original und Kopie archivieren.
  • Die Dateien sollten nicht auf andernorts gespeicherte Daten, Zeichensätzen, Formatvorlagen oder Programme verweisen sondern solche zusätzlichen Objekte sollten stattdessen mitarchiviert werden. Wenn solch eine Unabhängigkeit von externen Objekten nicht möglich ist, sollten Sie die bestehenden Abhängigkeiten in einer reinen Textdatei dokumentieren („Readme“). Das Readme legen Sie zusammen mit den Daten ab.
  • Dateien sollten nicht passwortgeschützt, verschlüsselt oder komprimiert sein. Falls Sie zwingend Daten verschlüsseln müssen, treffen Sie Vorkehrungen, damit Daten auch nach Ihrem Weggang von einer berechtigen Person geöfffnet werden können.
  • Verwenden Sie nur Buchstaben, Zahlen, Unterstrich (_) und Bindestrich (-) in den Namen von Ordnern und Dateien, also keine Leerzeichen, Schrägstriche, Umlaute, usw. 1(siehe auch diese Aufstellung).
  • Die Dateinamenerweiterung sollte konsistent mit dem tatsächlichen Dateiformat sein.

...

Für ausführlichere Informationen verweisen wir auf die Empfehlungen des Bundesarchivs2, der KOST3, des Forschungsdatenzentrums Archäologie & Altertumswissenschaften IANUS4, der Library of Congress5 und  und der Harvard Library6. Die Tabelle in Rimkus et al., 20147 fasst  fasst die Bewertungen verschiedener Archive zusammen.

...

DateiartEmpfohlene Konvertierungen
Text
  • Sie sollten Word und PowerPoint Dateien möglichst zu PDF/A-1b Dateien konvertieren. Für Microsoft-Dateien Word oder PowerPoint Dateien führt dazu gemäss unseren Tests folgende Methode häufig zu akzeptablen Resultaten: Die Datei mit Word oder PowerPoint öffnen, dann unter Menu "Datei", „Drucken“ auswählen. Bei Drucker „Adobe PDF“ auswählen. Das Feld „Druckereigenschaften“ anwählen und dort „PDF/A-1b: 2005 (RGB)“ auswählen. Dann Schaltfläche „Drucken“. Vgl. auch die ausführliche Anleitung zu diesem Thema.
  • LaTeX oder TeX möglichst zu PDF/A konvertieren.
  • Sie müssen die Qualität von Konvertierungen sorgfältig visuell überprüfen. Achten Sie dabei insbesondere auf Formeln, Sonderzeichen, Umlaute, spezielle Fonts, Textschreibfehler, Auswählen und Suchen im Text, Tabellen, Farben, transparente Objekte, Kommentare, Vektorgraphiken sowie mehrfache Zeichenebenen.
Tabellen
  • Excel *.xls Dateien zu *.xlsx konvertieren
  • Für wichtige eingebettete Objekte (wie z. B. Figuren) sollten sie möglichst auch eine Kopie als separate Datei abspeichern
  • Tabellen könnten Sie folgendermassen zu ASCII Text Dateien (*.csv) konvertieren: In Excel die einzelnen Blätter als *.csv Datei speichern, in R Tabellen mit write.csv speichern und in S-Plus mit „write.table“ als *.sdd Datei speichern.
Workspace Dump in Matlab, R oder S-Plus
  • Matlab *.mat Files als v7.3 MAT Dateien abspeichern (mit save -v7.3 x.mat), weil es dadurch einem HDF5-basierten Standard folgt. (HDF5 8 ist ein offener Standard für Tabellen, Mediadaten und komplexe Datenstrukturen. Siehe auch HDF5 User's Guide)
  • Der R Workspace sollte mit dem Packet rhadf59 in HDF5 Format gespeichert werden. Die S-Plus Funktion data.dump produziert ein File welches mit der R-Funktion data.restore10 gelesen werden kann.
  • Für komplexe Datenstrukturen ist es meist nicht sinnvoll den Workspace als ASCII zu speichern, weil dies auf schwer lesbare Dateien führt. (Einen solchen ASCII Workspace Dump erhält man in mit save(…, ascii = TRUE), in Matlab mit save file.txt –ascii und in S-Plus mit dump().)
  • Wichtige Tabellen im Workspace sollten zusätzlich als CSV-Datei gespeichert werden.
Grafik
  • Vektorgrafikdateien werden langfristig eher schwieriger zu öffnen sein als Rastergrafikdateien (Bitmaps). Auch das Einbetten von Vektorgrafik in PDF Dateien ist fehleranfällig. Dateien in speziellen Vektorgrafik Formaten, wie InDesign (*.indd) oder Illustrator (*.ait), sollten Sie möglichst auch in einem geeigneteren Format speichern (linke Spalte in Tabelle 1). Sie sollten die Qualität der Konvertierung sorgfältig visuell überprüfen (Schärfe, Auflösung, Farben, halbdurchsichtige Objekte, Beschriftungen).

...

Die kostenfreie JAVA Applikation DROID 11 erlaubt Ihnen für grosse Dateisammlungen einen Überblick über die benutzten Dateiformate. Zudem können sowohl unbekannte Formate als auch Inkonsistenzen zwischen Inhalt und Dateinamenerweiterung ermittelt werden (Abbildung 1).

...

Abbildung 1: Screenshot zur Auswertung einiger Testdateien mit dem Programm DROID. Dateien mit unklaren oder unbekannten Formaten können mit DROID schnell gefunden werden.

 

 

 

 

Stand und Zugriff auf Quellen: 13. März 2017:

1 http://support.apple.com/de-ch/HT5923 (OS X: Bewährte Vorgehensweisen und Methoden für plattformübergreifende Dateinamen, 23.12.2013)

2 https://www.bar.admin.ch/dam/bar/de/dokumente/konzepte_und_weisungen/archivtaugliche_dateiformate.1.pdf.download.pdf/archivtaugliche_dateiformate.pdf (Archivtaugliche Dateiformate - Schweizerisches Bundesarchiv, Version vom Januar 2014)

3 http://kost-ceco.ch/wiki/whelp/KaD/index.php?ld (Katalog archivischer Dateiformate, kost-ceco)

4 http://www.ianus-fdz.de/it-empfehlungen/dateiformate (IANUS, Forschungsdatenzentrum Archäologie & Altertumswissenschaften)

5 https://www.loc.gov/preservation/digital/formats/fdd/descriptions.shtml (Library of Congress, Digital Preservation, Sustainability of Digital Formats: Planning for Library of Congress Collections)

6 https://wiki.harvard.edu/confluence/display/digitalpreservation/Formats+Supported+by+the+DRS, (Formats Supported by the DRS, Harvard Library)

7 https://www.ideals.illinois.edu/bitstream/handle/2142/47421/FileFormatStatistics.pdf?sequence=4 (Data from “Digital Preservation File Format Policies of ARL Member Libraries: An Analysis”, Kyle Rimkus, Thomas Padilla, Tracy Popp and Greer Martin, D-Lib Magazine, Volume 20, Number 3/4, March/April 2014, doi:10.1045/march2014-rimkus)

8 https://support.hdfgroup.org/HDF5/doc1.8/UG/HDF5_Users_Guide.pdf (HDF5 User's Guide, HDF5 Release 1.8.x, November 2015)

9 http://www.bioconductor.org/packages/release/bioc/vignettes/rhdf5/inst/doc/rhdf5.pdf (rhdf5 - HDF5 interface for R, Bernd Fischer, 13. Okt. 2014)

10 http://cran.r-project.org/doc/manuals/r-release/R-data.html#EpiInfo-Minitab-SAS-S_002dPLUS-SPSS-Stata-Systat (R. Data Import/Export, 5. Dez., 2014)

11 http://www.nationalarchives.gov.uk/information-management/manage-information/preserving-digital-records/droid/ (Download DROID: file format identification tool; The National Archives, Version 6.1.5)