Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Dateiart

Geeignet zur Nutzung für mehr als zehn Jahre

Geeignet zur Nutzung beschränkt auf zehn JahreNicht geeignet zur Archivierung
Text
  • PDF/A (*.pdf)
  • Unformatierter Text (*.txt, *.asc, *.c, *.h, *.cpp, *.m, *.py usw.) kodiert als ASCII, UTF-8, oder UTF-16 mit Byte Order Mark
  • XML (inklusive XSD/XSL/XHTML, etc.; wobei Schema und Buchstabenkodierung explizit im File angegeben werden sollen)
  • PDF (*.pdf), wobei die Fonts im PDF File eingebettet sein müssen
  • Unformatierter Text (*.txt, *.asc, *.c, *.h, *.cpp, *.m, *.py usw.) (ISO 8859-1 kodiert)
  • Rich Text Format (*.rtf)
  • HTML (mit DOCTYPE Deklaration)
  • Word *.docx
  • PowerPoint *.pptx
  • LaTeX, TeX und TeX DVI (Die ASCII Texte sind langfristig lesbar; allenfalls benutzte lizenzfreie Softwarepakete mit Spezialfonts sollten möglichst mitgeliefert werden)
  • HTML und XML (Die ASCII Texte sind langfristig lesbar; externe Links möglichst vermeiden)Programmcode wie
  • OpenDocument Formate (*.odm, *.codt, *.cppodg, usw. (Die ASCII Texte sind langfristig lesbar; benutzte lizenzfreie Softwarepakete und Libraries sollten möglichst mitgeliefert werden.*.odc, *.odf)
  • Word *.doc
  • PowerPoint *.ppt
Spreadsheets und Tabellen
  • Komma- oder Tab-begrenzte Text Files (*.csv)
  • Excel *.xlsx (Containerformat)
  • OpenDocument Formate (*.odm, *.odt, *.odg, *.odc, *.odf)
  • Excel *.xls, *.xlsb (binäre Formate)
Workspace Speicherung für Matlab, R oder S-Plus 
  • Text Dateien für S-Plus (*.sdd). Der ASCII Text ist langfristig nutzbar, die spätere maschinelle Lesbarkeit ist jedoch unsicher.
  • Matlab *.mat in HDF Format speichern, denn nichttriviale Matlab *.mat ASCII Files können mit load nicht gelesen werden (siehe Tabelle 2).
  • Network Common Data Format oder NetCDF (*.nc, *.cdf)
  • Binäre Dateien wie Matlab Dateien *.mat (binär), R Dateien *.RData
Rastergrafik (Bitmap)
  • TIFF (*.tif) (unkomprimiert, möglichst TIFF 6.0, Part 1: Baseline TIFF) PNG (unkomprimiertTIFFwird gegenüber PNG und JPEG2000 bevorzugt.
  • Portable Network Graphics (*.png, compression level 0)
  • JPEG2000 (verlustfreie Komprimierung)
  • Digital-Negative-Format (*.dng) falls man zusätzlich zu TIFF Files auch Rohdaten von digitalen Fotos behalten möchte.
  • TIFF (*.tif) (komprimiert)
  • GIF (*.gif)
  • BMP (*.bmp)
  • JPEG/JFIF (*.jpg)
  • JPEG2000 (verlustbehaftete Komprimierung) (*.jp2)
 
Vektorgrafik
  • SVG ohne JavaScript binding (*.svg)
 
  • Grafik InDesign (.indd), Illustrator (.ait)
  • Encapsulated Postscript (EPS)
CAD
  • AutoCAD Drawing (*.dwg)
  • Drawing Interchange Format, AutoCAD (*.dxf) 
  • Extensible 3D, X3D (*.x3d, *.x3dv, *.x3db)
  
Ton, Audio
  • WAV (*.wav) (unkomprimiert, pulse-code moduliert)
  • Advanced Audio Coding (*.mp4)
  • MP3 (*.mp3)
 
Video
  • Motion JPEG 2000 (ISO/ IEC15444-4) (*.mj2)
  • AVI (unkomprimiert, motion JPEG) (*.avi)
  • QuickTime Movie (unkomprimiert, motion JPEG) (*.mov)
  • MPEG-1, MPEG-2 (*.mpg,*.mpeg, in den Container Formaten AVI oder MOV)
  • MPEG-4 (H.263, H.264) (*.mp4, in den Container Formaten AVI oder MOV)
  • Windows Media Video (*.wmv)

...

  • Dateien in seltenen Formaten sollten Sie möglichst in übliche Formate konvertieren. Dabei sollten Sie jeweils Original und Kopie archivieren.
  • Die Dateien sollten nicht auf andernorts gespeicherte Daten, Zeichensätzen, Formatvorlagen oder Programme verweisen sondern solche zusätzlichen Objekte sollten stattdessen mitarchiviert werden. Wenn solch eine Unabhängigkeit von externen Objekten nicht möglich ist, sollten Sie die bestehenden Abhängigkeiten in einer reinen Textdatei dokumentieren („Readme“). Das Readme legen Sie zusammen mit den Daten ab.
  • Dateien sollten nicht passwortgeschützt, verschlüsselt oder komprimiert sein. Falls Sie zwingend Daten verschlüsseln müssen, treffen Sie Vorkehrungen, damit Daten auch nach Ihrem Weggang von einer berechtigen Person geöfffnet werden können.
  • Verwenden Sie nur Buchstaben, Zahlen, Unterstrich (_) und Bindestrich (-) in den Namen von Ordnern und Dateien, also keine Leerzeichen, Schrägstriche, Umlaute, usw.1
  • Die Dateinamenerweiterung sollte konsistent mit dem tatsächlichen Dateiformat sein.

...

Für eine Aufbewahrung von mehr als zehn Jahren können wir nur Dateitypen Dateiformate in der linken Kolonne von Tabelle 1 empfehlen, also insbesondere PDF/A, ASCII Text , TIFF, undTIFF. Unter Umständen sind auch PNG, SVG und JPEG2000 geeignet. Dabei hängt die zukünftige Lesbarkeit einer Datei auch stark von den benutzten Dateieigenschaften Formateigenschaften ab: Fortgeschrittene Möglichkeiten eines Formats, wie Video innerhalb einer PDF Datei, werden schwieriger zu lesen sein sind weniger langzeittauglich als die grundlegenden Möglichkeiten des Formats.

Für ausführlichere Informationen verweisen wir auf die Empfehlungen des Bundesarchivs2, der KOST3, des Forschungsdatenzentrums Archäologie & Altertumswissenschaften IANUS4, der Library of Congress5 und der Harvard Library6. Die Tabelle in Rimkus et al., 20147 fasst die Bewertungen verschiedener Archive zusammen.

Die ETH-Bibliothek wird die archivierten Dateiformate periodisch überprüfen und wird sich bemühen, veraltete Formate möglichst in gebräuchlichere Formate zu konvertieren. Die Originaldatei wird dabei immer mit-archiviert.

...

Abbildung 1: Screenshot zur Auswertung einiger Testdateien mit dem Programm DROID. Dateien mit unklaren oder unbekannten Formaten können mit DROID schnell gefunden werden.

 

 

 

Stand und Zugriff auf Quellen: 13. März 2017:

1 http://support.apple.com/de-ch/HT5923 (OS X: Bewährte Vorgehensweisen und Methoden für plattformübergreifende Dateinamen, 23.12.2013)

2 https://www.bar.admin.ch/dam/bar/de/dokumente/konzepte_und_weisungen/archivtaugliche_dateiformate.1.pdf.download.pdf/archivtaugliche_dateiformate.pdf (Archivtaugliche Dateiformate - Schweizerisches Bundesarchiv, Version vom Januar 2014)

3 http://kost-ceco.ch/wiki/whelp/KaD/index.php?ld (Katalog archivischer Dateiformate, kost-ceco)

4 http://www.ianus-fdz.de/it-empfehlungen/dateiformate (IANUS, Forschungsdatenzentrum Archäologie & Altertumswissenschaften)

5 https://www.loc.gov/preservation/digital/formats/fdd/descriptions.shtml (Library of Congress, Digital Preservation, Sustainability of Digital Formats: Planning for Library of Congress Collections)

6 https://wiki.harvard.edu/confluence/display/digitalpreservation/Formats+Supported+by+the+DRS, (Formats Supported by the DRS, Harvard Library)

7 https://www.ideals.illinois.edu/bitstream/handle/2142/47421/FileFormatStatistics.pdf?sequence=4 (Data from “Digital Preservation File Format Policies of ARL Member Libraries: An Analysis”, Kyle Rimkus, Thomas Padilla, Tracy Popp and Greer Martin, D-Lib Magazine, Volume 20, Number 3/4, March/April 2014, doi:10.1045/march2014-rimkus)

8 https://support.hdfgroup.org/HDF5/doc1.8/UG/HDF5_Users_Guide.pdf (HDF5 User's Guide, HDF5 Release 1.8.x, November 2015)

9 http://www.bioconductor.org/packages/release/bioc/vignettes/rhdf5/inst/doc/rhdf5.pdf (rhdf5 - HDF5 interface for R, Bernd Fischer, 13. Okt. 2014)

10 http://cran.r-project.org/doc/manuals/r-release/R-data.html#EpiInfo-Minitab-SAS-S_002dPLUS-SPSS-Stata-Systat (R. Data Import/Export, 5. Dez., 2014)

11 http://www.nationalarchives.gov.uk/information-management/manage-information/preserving-digital-records/droid/ (Download DROID: file format identification tool; The National Archives, Version 6.1.5)