Dienstag, 30. Mai 2017

Bibtag - und 'ne Kleinigkeit gelernt

Heute hatte ich einen Abstecher zum Bibliothekartag 2017 nach Frankfurt am Main gemacht. Zum einen, um etliche Ex-Kommilitonen zu treffen, zum anderen war ich am Workshop von Yvonne Tunnat von der ZBW zur Formatidentifikation interessiert.

Yvonne hat eine wunderbare, pragmatische Art komplizierte Sachverhalte zu erklären. Wer sie kennenlernen möchte, der nestor-Praktikertag 2017 zur Formatvalidierung hat noch Plätze frei.

Zwei Dinge, die ich mitnehme. Zum einen kannte ich das Werkzeug peepdf noch nicht. Es handelt sich um ein CLI-Programm um eine PDF-Datei zu sezieren und kommt ursprünglich aus der Forensik-Ecke.

Zum anderen gibt es mit Bad Peggy ein Validierungstool um JPEGs zu analysieren.

Eine Diskussion, die immer wieder auftaucht ist die, wie man mit unbekannten Dateiformaten umgeht. IMHO sind diese nicht archivfähig, und wie Binärmüll zu betrachten. Dazu bedarf es aber mal eines längeren Beitrags und einer genaueren Analyse, ob und unter welchen Bedingungen solche Dateien vernachlässigbar sind, oder der long-tail zuschlägt.

BTW., wer am Mittwoch noch auf dem Bibtag ist, schaue mal beim Vortrag unserer Kollegin Sabine zu den Ergebnissen der PDF/A Validierung vorbei.

1 Kommentar:

  1. Hi Andreas,
    danke für das Lob. Das freut mich sehr!
    Zum Thema Binärmüll fällt mir noch ein:
    Es ging ja bei dem Workshop eher darum, ob man Dateien archiviert, obwohl DROID sie nicht erkennt. Die meisten Dateien kennt man ja schon (vieles waren auch einfach verschiedene txt-files wie Source Code und co, das könnte man mit dem Tool analysieren, das auch GitHub verwendet), nur DROID eben halt nicht.
    Aber ja, das würde einen längeren Beitrag geben und letztendlich gibt's vermutlich nur verschiedene Strategien, so wie bei so vielen anderen Dingen auch.
    Bis nächste Woche beim Praktikertag, viele Grüße, Yvonne

    AntwortenLöschen