Project Description

Für das geologische Archiv des Bundesamtes für Landestopografie (swisstopo) hat soom-it eine Lösung zur Verarbeitung von retrodigitalisierten Mikrofilm-Fichen konzipiert und umgesetzt. Unsere Softwarelösung basiert auf einem OpenStack-Cluster, welcher ein Hadoop-Cluster betreibt. Unsere Hadoop-Pipeline hat die Verarbeitung der Daten, die manuell mehrere Jahre in Anspruch nehmen würde, auf ein paar Tage verkürzt.

Kunde

Bundesamt für Landestopografie swisstopo

Herausforderungen

  • Grosse Sammlung an digitalen Fichen in der Form von riesigen Bildern mittels eines Tools zerlegen.
  • Datenhaltung in der Schweiz.
  • Datenmenge auf Standardrechner nicht verarbeitbar.

Lösungen

  • Bau eines kleinen Servers zur parallelen Verarbeitung der Daten.
  • Tool, welches automatisch aus grossen Bildern PDFs mit Einzelseiten erstellt.